Introducción al modelo Llama 3
- Meta presentó el modelo Llama 3. Ofrece versiones preentrenadas y ajustadas por instrucciones de 8B y 70B, para apoyar el desarrollo de diversas aplicaciones.
- Llama 3 está integrado en Meta AI y puede usarse para tareas de programación y resolución de problemas. Esto permite experimentar directamente el rendimiento de Llama 3.
- Se espera que Llama 3 ofrezca las capacidades y la flexibilidad necesarias para el desarrollo de agentes y aplicaciones basadas en IA.
Mejoras de rendimiento de Llama 3
- Llama 3 es un modelo de última generación con acceso abierto que muestra un rendimiento sobresaliente en tareas complejas como matices del lenguaje, comprensión de contexto, traducción y generación de diálogo.
- Con mejor escalabilidad y rendimiento, Llama 3 puede manejar tareas de varios pasos con facilidad. El proceso mejorado de posentrenamiento reduce de forma significativa la tasa de rechazos falsos, mejora la alineación de las respuestas y aumenta la diversidad de las respuestas del modelo.
- También mejora de manera notable capacidades como razonamiento, generación de código y ejecución de instrucciones. Con Llama 3 se puede construir el futuro de la IA.
Benchmarks del modelo Llama 3
- El modelo Llama 3 lleva los datos y la escala a un nuevo nivel. Fue entrenado con más de 15 billones de tokens en dos clústeres de 24K GPU anunciados recientemente; esto es 7 veces más grande que el conjunto de datos de entrenamiento usado en Llama 2 y contiene 4 veces más código.
- Como resultado, nació el modelo Llama con mejor rendimiento hasta ahora, y admite una longitud de contexto de 8K, el doble de la capacidad de Llama 2.
Enfoque integral para un uso responsable de Llama 3
- Junto con el lanzamiento de Llama 3, se actualizó la Guía de Uso Responsable (RUG) para ofrecer la información más completa sobre desarrollo responsable con LLM.
- Se realizaron actualizaciones en las herramientas de confianza y seguridad, incluyendo Llama Guard 2, Code Shield y Cybersec Eval 2, optimizadas para respaldar la nueva taxonomía publicada por MLCommons.
- De acuerdo con los principios especificados en la RUG, se recomienda revisar y filtrar minuciosamente todas las entradas y salidas del LLM con base en lineamientos de contenido propios, adecuados para cada caso de uso y audiencia objetivo.
Opinión de GN⁺
- Además de la mejora de rendimiento de Llama 3, resulta llamativo que también se hayan proporcionado lineamientos para un desarrollo responsable. Cuanto más potente sea un modelo de IA, más debe acompañarse de esfuerzos para usarlo correctamente.
- Sin embargo, por la naturaleza de los proyectos de código abierto, no parece haber una manera de obligar al cumplimiento de esos lineamientos. Parece que será necesaria la colaboración voluntaria de los desarrolladores.
- Se espera que Llama 3 muestre un rendimiento comparable al de los modelos más recientes de OpenAI, como GPT-4, pero todavía no se han publicado resultados de benchmarks objetivos. Da curiosidad ver su rendimiento real en diversas tareas.
- Al tratarse de un proyecto de código abierto, se espera que distintas organizaciones y desarrolladores, además de Meta, presenten proyectos interesantes usando Llama 3. Será una oportunidad para comprobar el potencial de Llama 3.
1 comentarios
Comentarios de Hacker News
Hay comentarios agradeciendo que Meta haya adoptado un enfoque de código abierto y comparta los pesos del modelo, el tokenizador e información sobre los datos de entrenamiento, entre otras cosas. Gracias a este enfoque abierto de Meta, ahora es posible ejecutar localmente modelos bastante decentes en hardware de consumo.
Junto con el lanzamiento de Llama 3, Meta anunció que será posible probar Meta AI multimodal en los smart glasses Ray-Ban Meta. También se plantea la opinión de que las interfaces tradicionales de computadora/smartphone desaparecerán, salvo por algunas aplicaciones de nicho, y que en su lugar todos tendrán su propio asistente de IA con el que podrán interactuar de forma tan natural como cuando interactúan con otras personas.
Hay quien quiere ver modelos que se ajusten bien a GPUs de consumo con 24 GB, por ejemplo un modelo 20B cuantizado a 8 bits o un modelo 40B que pueda cuantizarse a 4 bits. Se comenta que fue decepcionante que Meta dejara de publicar modelos 30B después de Llama 1.
La tarjeta del modelo de Llama 3 incluye resultados de benchmarks frente a otros modelos Llama. Resulta impresionante la mejora drástica de rendimiento de Llama 3 frente a Llama 2, y parece que duplicar la ventana de contexto a 8k abrirá muchas oportunidades nuevas.
También se comparte que Zuckerberg dio una entrevista sobre Llama 3.