1 puntos por GN⁺ 2024-05-27 | Aún no hay comentarios. | Compartir por WhatsApp
  • Una base de código ligera que permite ajustar finamente los modelos de Mistral con eficiencia de memoria y rendimiento
  • Basado en LoRA, la mayoría de los pesos quedan congelados y solo se entrena un 1–2% adicional de pesos en forma de Low-Rank Matrix Perturbation
  • Para maximizar la eficiencia, se recomienda usar GPUs A100 o H100, y la base de código está optimizada para configuraciones de entrenamiento multi-GPU en un solo nodo, aunque para modelos pequeños como 7B una sola GPU también es suficiente

Nota: el objetivo de este repositorio es ofrecer un punto de entrada simple y guiado para ajustar finamente modelos de Mistral. Por eso, tiene posturas bastante definidas (especialmente en lo relacionado con el formato de datos) y no busca ser exhaustivo en distintas arquitecturas de modelos o tipos de hardware. Para un enfoque más general, vale la pena revisar otros excelentes proyectos como torchtune

Aún no hay comentarios.

Aún no hay comentarios.