Mistral-finetune - Ajustar finamente modelos de Mistral
(github.com/mistralai)- Una base de código ligera que permite ajustar finamente los modelos de Mistral con eficiencia de memoria y rendimiento
- Basado en LoRA, la mayoría de los pesos quedan congelados y solo se entrena un 1–2% adicional de pesos en forma de Low-Rank Matrix Perturbation
- Para maximizar la eficiencia, se recomienda usar GPUs A100 o H100, y la base de código está optimizada para configuraciones de entrenamiento multi-GPU en un solo nodo, aunque para modelos pequeños como 7B una sola GPU también es suficiente
Nota: el objetivo de este repositorio es ofrecer un punto de entrada simple y guiado para ajustar finamente modelos de Mistral. Por eso, tiene posturas bastante definidas (especialmente en lo relacionado con el formato de datos) y no busca ser exhaustivo en distintas arquitecturas de modelos o tipos de hardware. Para un enfoque más general, vale la pena revisar otros excelentes proyectos como torchtune
Aún no hay comentarios.