13 puntos por xguru 2024-04-29 | 3 comentarios | Compartir por WhatsApp
  • Desde la presentación del modelo Llama 3 el 18/4, la reacción de la comunidad de desarrolladores fue enorme
    • El modelo se descargó más de 1.2 millones de veces, y los desarrolladores compartieron más de 600 modelos derivados en Hugging Face
    • El repositorio de Llama 3 en GitHub recibió más de 17,000 estrellas
    • En la tabla de posiciones de LMSYS Chatbot Arena, el modelo Llama 3 70B Instruct obtuvo el 1.º lugar en la evaluación solo en inglés, y el 6.º lugar en general, logrando la posición más alta entre los modelos abiertos publicados (solo por detrás de modelos cerrados y propietarios)

Casos iniciales de adopción de Llama 3

  • Los socios de silicio, hardware y proveedores de nube empezaron a desplegar Llama 3 para sus usuarios
  • La Facultad de Medicina de Yale, junto con la Escuela de Ciencias de la Computación y la Comunicación de EPFL, ajustó finamente Llama 3 dentro de las 24 horas posteriores a su lanzamiento y presentó Llama-3[8B]-MeditronV1.0, el primer modelo Llama 3 8B para el campo médico
    • Este nuevo modelo superó a todos los modelos abiertos más recientes de la misma categoría de parámetros en benchmarks estándar como MedQA y MedMCQA
    • Más detalles sobre cómo Yale y EPFL construyeron la primera versión de Meditron basada en Llama 2 pueden consultarse en ese enlace

Planes futuros para Llama 3

  • En los próximos meses, planean publicar modelos con nuevas capacidades, como multimodalidad, conversación multilingüe, ventanas de contexto más largas y mejoras generales de rendimiento
  • Esperan compartir más pronto y ver la próxima ola de innovación impulsada por la comunidad

3 comentarios

 
gcback 2024-04-29

Cada vez más, los LLM de las grandes empresas coreanas están perdiendo competitividad. Si su estrategia es ser cerrados, entonces deberían tener un rendimiento lo bastante competitivo; o, si la estrategia es ampliar los casos de uso aunque el rendimiento sea inferior, entonces no deberían poner el foco en el coreano. Pero la situación es exactamente la contraria.

 
cosine20 2024-04-30

En el leaderboard en coreano solo están haciendo una competencia inútil de pesos, y con eso inflan las noticias para defender el precio de la acción jajaja

 
[Este comentario fue ocultado.]