Alpaca: un potente modelo open source de seguimiento de instrucciones al nivel de GPT-3.5
(crfm.stanford.edu)- En Stanford CRFM ajustaron finamente LLaMA 7B de Meta con 52K datos de instruction-following
- Funciona de forma similar a GPT-3.5 de OpenAI (
text-davinci-003), pero es mucho más pequeño y barato - Publican la receta de entrenamiento y los datos, y más adelante planean liberar también los pesos del modelo
- Se publica solo con fines de investigación y se prohíbe el uso comercial
- El ajuste fino tomó 3 horas en 8 A100 de 80 GB, y en la nube puede hacerse por menos de 100 dólares
1 comentarios
Repo: https://github.com/tatsu-lab/stanford_alpaca
Demo web: https://crfm.stanford.edu/alpaca/
La publicación de LLaMA realmente está creando un momento Stable Diffusion. Todo está cambiando muy rápido.