- Modelo ajustado sobre la base de Stanford Alpaca 7B/13B para que a los desarrolladores les resulte útil en tareas de programación
- Reemplazo con 20K de datos de instruction following relacionados con generación de código (usando la técnica Self-Instruct)
- Se modificó parcialmente el pipeline de generación de datos: se cambiaron los prompts para que se relacionen con generación/edición/optimización de código en lugar de tareas generales
- Ajustado finamente con código de entrenamiento de Hugging Face y Deepspeed
Aún no hay comentarios.