- Un modelo de lenguaje grande de código abierto que puede usarse tanto para investigación como para fines comerciales
- Entrenado con 2 billones de tokens de datos, un 40% más que Llama 1
- El doble de longitud de contexto: 4096
- Modelos en tres tamaños: 7B, 13B, 70B
- Mejor rendimiento que otros modelos de lenguaje de código abierto en muchos benchmarks como razonamiento, programación, competencia y pruebas de conocimiento (MPT, Falcon, Llama-1)
- Fue entrenado con fuentes de datos públicas, y el Llama-2-chat ajustado también aprovecha conjuntos de instrucciones públicos y más de un millón de anotaciones humanas
- Incluye en la descarga
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
3 comentarios
¿Esta vez también alguien va a soltar un magnet de torrent con fines de "bien público"?
Esta vez no fue necesario y lo anunciaron de inmediato.
Aunque hay diferencias según el área, las evaluaciones dicen que está casi al nivel de GPT-3.5 o incluso por encima.
Parece completamente abierto, pero tiene una restricción importante. Si es un "servicio con más de 700 millones de MAU", hay que pedirle una licencia a Meta, y Meta puede rechazarla.
Parece básicamente un "¡Google, TikTok, ustedes no lo usen!".
Microsoft se movió rápido y ya anunció que Llama 2 se podrá usar en Azure.
https://blogs.microsoft.com/blog/2023/…
Parece que Microsoft está manteniendo una buena relación tanto con OpenAI como con Meta.