Alpaca: un potente modelo open source de seguimiento de instrucciones al nivel de GPT-3.5

xguru · 2023-03-14T11:21:01+09:00

En Stanford CRFM ajustaron finamente LLaMA 7B de Meta con 52K datos de instruction-following Funciona de forma similar a GPT-3.5 de OpenAI (text-davinci-003), pero es mucho más pequeño y barato Publican la receta de entrenamiento y los datos, y más adelante planean liberar también los pesos del modelo Se publica solo con fines de investigación y se prohíbe el uso comercial El ajuste fino tomó 3 horas en 8 A100 de 80 GB, y en la nube puede hacerse por menos de 100 dólares

(crfm.stanford.edu)

19 puntos por xguru 2023-03-14 | 1 comentarios | Compartir por WhatsApp

En Stanford CRFM ajustaron finamente LLaMA 7B de Meta con 52K datos de instruction-following
Funciona de forma similar a GPT-3.5 de OpenAI (text-davinci-003), pero es mucho más pequeño y barato
Publican la receta de entrenamiento y los datos, y más adelante planean liberar también los pesos del modelo
Se publica solo con fines de investigación y se prohíbe el uso comercial
El ajuste fino tomó 3 horas en 8 A100 de 80 GB, y en la nube puede hacerse por menos de 100 dólares

1 comentarios

xguru 2023-03-14

Repo: https://github.com/tatsu-lab/stanford_alpaca
Demo web: https://crfm.stanford.edu/alpaca/

La publicación de LLaMA realmente está creando un momento Stable Diffusion. Todo está cambiando muy rápido.

Alpaca: un potente modelo open source de seguimiento de instrucciones al nivel de GPT-3.5

Lecturas relacionadas

1 comentarios