Stanford's Alpaca
- La gran debilidad del modelo LLaMA es la falta de "instruction tuning" para preguntas y respuestas
- Una de las grandes innovaciones de OpenAI fue añadir instruction tuning a GPT-3
- Stanford aporta aquí 52,000 ejemplos de entrenamiento y hace posible entrenarlo por solo $100
- El modelo más pequeño, 7B, ahora incluso corre en Raspberry Pi y teléfonos móviles, y produce resultados muy impresionantes
- Pero todavía no es para uso comercial (no es posible por 3 razones: la licencia de LLaMA / los datos del conjunto de instrucciones fueron generados con un modelo de OpenAI / no se diseñaron medidas de seguridad)
¿Qué significa esto?
- El modelo de licencia de LLaMA no me importa demasiado
- LLaMA demostró que es posible entrenar un modelo de lenguaje de clase GPT-3 con recursos generalmente disponibles
- llama.cpp demostró que los LLM pueden ejecutarse en hardware de consumo de alrededor de 4 GB
- Alpaca muestra que con 52K ejemplos y un costo de $100 también es posible hacer fine-tuning de un modelo 7B (reducido a 4 GB con cuantización de 4 bits), y obtener resultados similares al actual text-davinci-003
- Aunque lo usado para la comparación fue el modelo completo 7B (13.48 GB, coma flotante de 16 bits), no el modelo de 4 GB reducido a 4 bits; todavía no he visto material que compare con claridad la diferencia de calidad entre ambos
Aún no hay comentarios.