19 puntos por xguru 2023-07-19 | 3 comentarios | Compartir por WhatsApp
  • Un modelo de lenguaje grande de código abierto que puede usarse tanto para investigación como para fines comerciales
  • Entrenado con 2 billones de tokens de datos, un 40% más que Llama 1
  • El doble de longitud de contexto: 4096
  • Modelos en tres tamaños: 7B, 13B, 70B
  • Mejor rendimiento que otros modelos de lenguaje de código abierto en muchos benchmarks como razonamiento, programación, competencia y pruebas de conocimiento (MPT, Falcon, Llama-1)
  • Fue entrenado con fuentes de datos públicas, y el Llama-2-chat ajustado también aprovecha conjuntos de instrucciones públicos y más de un millón de anotaciones humanas
  • Incluye en la descarga
    • Model code
    • Model Weights
    • README (User Guide)
    • Responsible Use Guide
    • License
    • Acceptable Use Policy
    • Model Card

3 comentarios

 
kuroneko 2023-07-19

¿Esta vez también alguien va a soltar un magnet de torrent con fines de "bien público"?

 
tpdns90321 2023-07-19

Esta vez no fue necesario y lo anunciaron de inmediato.

 
xguru 2023-07-19

Aunque hay diferencias según el área, las evaluaciones dicen que está casi al nivel de GPT-3.5 o incluso por encima.

Parece completamente abierto, pero tiene una restricción importante. Si es un "servicio con más de 700 millones de MAU", hay que pedirle una licencia a Meta, y Meta puede rechazarla.

Parece básicamente un "¡Google, TikTok, ustedes no lo usen!".

Microsoft se movió rápido y ya anunció que Llama 2 se podrá usar en Azure.
https://blogs.microsoft.com/blog/2023/…

Parece que Microsoft está manteniendo una buena relación tanto con OpenAI como con Meta.