19 puntos por xguru 2023-03-14 | 1 comentarios | Compartir por WhatsApp
  • En Stanford CRFM ajustaron finamente LLaMA 7B de Meta con 52K datos de instruction-following
  • Funciona de forma similar a GPT-3.5 de OpenAI (text-davinci-003), pero es mucho más pequeño y barato
  • Publican la receta de entrenamiento y los datos, y más adelante planean liberar también los pesos del modelo
  • Se publica solo con fines de investigación y se prohíbe el uso comercial
  • El ajuste fino tomó 3 horas en 8 A100 de 80 GB, y en la nube puede hacerse por menos de 100 dólares

1 comentarios

 
xguru 2023-03-14

Repo: https://github.com/tatsu-lab/stanford_alpaca
Demo web: https://crfm.stanford.edu/alpaca/

La publicación de LLaMA realmente está creando un momento Stable Diffusion. Todo está cambiando muy rápido.