Stability AI presenta StableVicuna, el primer chatbot LLM open source con RLHF del mundo
(stability.ai)- Vicuna v0 13B con ajuste fino de instrucciones y entrenamiento RLHF
- SFT (Supervised Fine-Tuning) usando 3 conjuntos de datos
- OpenAssistant Conversations Dataset (OASST1)
- GPT4All Prompt Generations
- Alpaca
- Disponible para descarga en HuggingFace como delta de pesos para el modelo LLaMA (se requieren los datos originales de LLaMA)
Aún no hay comentarios.