Meta presenta Llama 2, su modelo de lenguaje de próxima generación

xguru · 2023-07-19T10:02:01+09:00

Un modelo de lenguaje grande de código abierto que puede usarse tanto para investigación como para fines comerciales Entrenado con 2 billones de tokens de datos, un 40% más que Llama 1 El doble de longitud de contexto: 4096 Modelos en tres tamaños: 7B, 13B, 70B Mejor rendimiento que otros modelos de lenguaje de código abierto en muchos benchmarks como razonamiento, programación, competencia y pruebas de conocimiento (MPT, Falcon, Llama-1) Fue entrenado con fuentes de datos públicas, y el Llama-2-chat ajustado también aprovecha conjuntos de instrucciones públicos y más de un millón de anotaciones humanas Incluye en la descarga Model code Model Weights README (User Guide) Responsible Use Guide License Acceptable Use Policy Model Card

(ai.meta.com)

19 puntos por xguru 2023-07-19 | 3 comentarios | Compartir por WhatsApp

Un modelo de lenguaje grande de código abierto que puede usarse tanto para investigación como para fines comerciales
Entrenado con 2 billones de tokens de datos, un 40% más que Llama 1
El doble de longitud de contexto: 4096
Modelos en tres tamaños: 7B, 13B, 70B
Mejor rendimiento que otros modelos de lenguaje de código abierto en muchos benchmarks como razonamiento, programación, competencia y pruebas de conocimiento (MPT, Falcon, Llama-1)
Fue entrenado con fuentes de datos públicas, y el Llama-2-chat ajustado también aprovecha conjuntos de instrucciones públicos y más de un millón de anotaciones humanas
Incluye en la descarga
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card

3 comentarios

kuroneko 2023-07-19

¿Esta vez también alguien va a soltar un magnet de torrent con fines de "bien público"?

tpdns90321 2023-07-19

Esta vez no fue necesario y lo anunciaron de inmediato.

xguru 2023-07-19

Aunque hay diferencias según el área, las evaluaciones dicen que está casi al nivel de GPT-3.5 o incluso por encima.

Parece completamente abierto, pero tiene una restricción importante. Si es un "servicio con más de 700 millones de MAU", hay que pedirle una licencia a Meta, y Meta puede rechazarla.

Parece básicamente un "¡Google, TikTok, ustedes no lo usen!".

Microsoft se movió rápido y ya anunció que Llama 2 se podrá usar en Azure.
https://blogs.microsoft.com/blog/2023/…

Parece que Microsoft está manteniendo una buena relación tanto con OpenAI como con Meta.

Meta presenta Llama 2, su modelo de lenguaje de próxima generación

Lecturas relacionadas

3 comentarios