- Modelo de lenguaje grande con estilo de asistente
- Publican por completo los datos recolectados, el procedimiento de recolección de datos, el código de entrenamiento y los pesos finales del modelo
- Entrenado con 800k datos generados con GPT 3.5 Turbo (código/historias/conversaciones)
- Utiliza como conjuntos de datos base LAION OIG, preguntas de programación de Stack Overflow y el ajuste por instrucciones de Big-Science/P3
- Toma como referencia Stanford Alpaca, entre otros, y sube los datos a ATLAS para su curación y limpieza
Aún no hay comentarios.