21 puntos por xguru 2023-03-27 | Aún no hay comentarios. | Compartir por WhatsApp
  • Modelo ajustado sobre la base de Stanford Alpaca 7B/13B para que a los desarrolladores les resulte útil en tareas de programación
  • Reemplazo con 20K de datos de instruction following relacionados con generación de código (usando la técnica Self-Instruct)
  • Se modificó parcialmente el pipeline de generación de datos: se cambiaron los prompts para que se relacionen con generación/edición/optimización de código en lugar de tareas generales
  • Ajustado finamente con código de entrenamiento de Hugging Face y Deepspeed

Aún no hay comentarios.

Aún no hay comentarios.