- Desde la presentación del modelo Llama 3 el 18/4, la reacción de la comunidad de desarrolladores fue enorme
- El modelo se descargó más de 1.2 millones de veces, y los desarrolladores compartieron más de 600 modelos derivados en Hugging Face
- El repositorio de Llama 3 en GitHub recibió más de 17,000 estrellas
- En la tabla de posiciones de LMSYS Chatbot Arena, el modelo Llama 3 70B Instruct obtuvo el 1.º lugar en la evaluación solo en inglés, y el 6.º lugar en general, logrando la posición más alta entre los modelos abiertos publicados (solo por detrás de modelos cerrados y propietarios)
Casos iniciales de adopción de Llama 3
- Los socios de silicio, hardware y proveedores de nube empezaron a desplegar Llama 3 para sus usuarios
- La Facultad de Medicina de Yale, junto con la Escuela de Ciencias de la Computación y la Comunicación de EPFL, ajustó finamente Llama 3 dentro de las 24 horas posteriores a su lanzamiento y presentó Llama-3[8B]-MeditronV1.0, el primer modelo Llama 3 8B para el campo médico
- Este nuevo modelo superó a todos los modelos abiertos más recientes de la misma categoría de parámetros en benchmarks estándar como MedQA y MedMCQA
- Más detalles sobre cómo Yale y EPFL construyeron la primera versión de Meditron basada en Llama 2 pueden consultarse en ese enlace
Planes futuros para Llama 3
- En los próximos meses, planean publicar modelos con nuevas capacidades, como multimodalidad, conversación multilingüe, ventanas de contexto más largas y mejoras generales de rendimiento
- Esperan compartir más pronto y ver la próxima ola de innovación impulsada por la comunidad
3 comentarios
Cada vez más, los LLM de las grandes empresas coreanas están perdiendo competitividad. Si su estrategia es ser cerrados, entonces deberían tener un rendimiento lo bastante competitivo; o, si la estrategia es ampliar los casos de uso aunque el rendimiento sea inferior, entonces no deberían poner el foco en el coreano. Pero la situación es exactamente la contraria.
En el leaderboard en coreano solo están haciendo una competencia inútil de pesos, y con eso inflan las noticias para defender el precio de la acción jajaja