Alpaca-LoRA: Ajuste por instrucciones de LLaMA de bajo rango
(github.com/tloen)- Probar el ajuste por instrucciones de LLaMA en hardware personal usando Low-Rank Adaptation
- Un modelo que puede ejecutarse en una Raspberry Pi y aun así ofrece una calidad similar a
text-davinci-003 - El código de entrenamiento puede ejecutarse en menos de 5 horas en una sola RTX 4090
- Usa PEFT (Parameter-Efficient Fine-Tuning) de Hugging Face y
bitsandbytesde Tim Dettmers para un fine-tuning barato y eficiente
Aún no hay comentarios.