16 puntos por xguru 2023-05-01 | Aún no hay comentarios. | Compartir por WhatsApp
  • Vicuna v0 13B con ajuste fino de instrucciones y entrenamiento RLHF
  • SFT (Supervised Fine-Tuning) usando 3 conjuntos de datos
    • OpenAssistant Conversations Dataset (OASST1)
    • GPT4All Prompt Generations
    • Alpaca
  • Disponible para descarga en HuggingFace como delta de pesos para el modelo LLaMA (se requieren los datos originales de LLaMA)

Aún no hay comentarios.

Aún no hay comentarios.