- Longitud de contexto de 128K, soporte para 8 idiomas y se agrega el modelo 405B (8B, 70B, 405B)
- Modelo de IA open source ajustado por instrucciones que cualquiera puede afinar, refinar y desplegar en cualquier lugar
- El nuevo modelo 405B alcanza un nivel casi igual o mejor que GPT-4o en benchmarks como MMLU (general), Human Eval (código) y GSM8K (matemáticas)
- Un modelo de IA de primer nivel en flexibilidad y control
- Permite que la comunidad aproveche nuevos flujos de trabajo como generación de datos sintéticos y destilación de modelos
- Fue entrenado con más de 15 billones de tokens y usando más de 16,000 GPU H100
- El modelo 70B mejorado supera ampliamente a GPT-3.5 Turbo en la mayoría de los benchmarks
3 comentarios
Vaya, me pregunto cómo habría que configurar las GPU para poder levantar 405B.
Parece que el 405B no está pensado para fine-tuning directo ni para serving. Como el CEO mencionó varias veces la destilación, da la impresión de que podría usarse como modelo teacher para fine-tuning y así mejorar la calidad de modelos más ligeros.
Opiniones en Hacker News
Los modelos Llama 3.1 mejoraron su rendimiento
Comparación entre GPT-4o y el modelo Llama 3.1 405B
En Groq.com se puede conversar con los nuevos modelos con latencia ultrabaja
Si se usa el hardware adecuado, es posible ejecutar en casa un LLM que compita con GPT-4o
Es posible ejecutar los modelos localmente con Ollama, Huggingface, Groq y otros
El resultado de ejecutar la versión 70B en Ollama fue muy bueno
Claude 3.5 Sonnet es muy bueno para tareas de programación
Consulta sobre la información de precios de los modelos open source