Alpaca-LoRA: Ajuste por instrucciones de LLaMA de bajo rango

xguru · 2023-03-22T10:17:02+09:00

Probar el ajuste por instrucciones de LLaMA en hardware personal usando Low-Rank Adaptation Un modelo que puede ejecutarse en una Raspberry Pi y aun así ofrece una calidad similar a text-davinci-003 El código de entrenamiento puede ejecutarse en menos de 5 horas en una sola RTX 4090 Usa PEFT (Parameter-Efficient Fine-Tuning) de Hugging Face y bitsandbytes de Tim Dettmers para un fine-tuning barato y eficiente

(github.com/tloen)

19 puntos por xguru 2023-03-22 | Aún no hay comentarios. | Compartir por WhatsApp

Probar el ajuste por instrucciones de LLaMA en hardware personal usando Low-Rank Adaptation
Un modelo que puede ejecutarse en una Raspberry Pi y aun así ofrece una calidad similar a text-davinci-003
El código de entrenamiento puede ejecutarse en menos de 5 horas en una sola RTX 4090
Usa PEFT (Parameter-Efficient Fine-Tuning) de Hugging Face y bitsandbytes de Tim Dettmers para un fine-tuning barato y eficiente

Alpaca-LoRA: Ajuste por instrucciones de LLaMA de bajo rango

Lecturas relacionadas

Aún no hay comentarios.