Meta lanzará la próxima semana versiones pequeñas de Llama 3

(theinformation.com)

6 puntos por GN⁺ 2024-04-09 | Aún no hay comentarios. | Compartir por WhatsApp

La versión más grande de Llama 3 está prevista para este verano, mientras que dos modelos pequeños se lanzarán la próxima semana
El lanzamiento de los modelos pequeños aumentará la expectativa en torno a Llama 3
Se espera que Llama 3 tenga capacidad de preguntas y respuestas basadas en imágenes, como GPT-4 de OpenAI
La versión más grande será un modelo multimodal capaz de entender y generar tanto texto como imágenes
En cambio, los dos modelos pequeños que se lanzarán la próxima semana no serán multimodales

Ventajas y desventajas según el tamaño del modelo

Los modelos pequeños suelen ser más baratos de ejecutar y más rápidos que los grandes
Esto se valora cada vez más al considerar el costo de ejecutar modelos de gran escala
Los modelos pequeños también son útiles para desarrolladores que quieren crear software de IA para dispositivos móviles

Estado del desarrollo de los modelos Llama de Meta

Meta ya había lanzado antes tres modelos de Llama 2
- El modelo más grande tiene 70 mil millones de parámetros
- Los otros dos modelos tienen 13 mil millones y 7 mil millones de parámetros, respectivamente
Se espera que la versión más grande de Llama 3 tenga más de 140 mil millones de parámetros
Meta utiliza Llama 2 para ofrecer funciones de asistente de IA en sus propias apps
En los últimos meses, empleados de la división de IA generativa de Meta han estado trabajando para hacer que Llama 3 sea más abierto, al considerar que Llama 2 responde de forma demasiado conservadora a preguntas controvertidas

Opinión de GN⁺

El lanzamiento de una versión pequeña de Llama 3 por parte de Meta Platforms muestra que la competencia en el campo de los modelos de lenguaje de IA se está intensificando. En un contexto donde grandes actores como Google y xAI de Elon Musk ya están lanzando modelos de código abierto, este movimiento de Meta puede interpretarse como una estrategia para asegurar cuota de mercado y mantener el liderazgo tecnológico.
El lanzamiento de modelos en versión pequeña puede ser una estrategia de marketing para ofrecer nuevas herramientas a desarrolladores e investigadores, y al mismo tiempo elevar el interés y la expectativa por la versión más grande del modelo. Esto da a los usuarios la oportunidad de experimentar y familiarizarse con modelos pequeños antes de usar realmente el modelo grande.
El lanzamiento de modelos de lenguaje grandes es técnicamente muy complejo, y para entrenarlos y mantenerlos de manera efectiva se requieren recursos computacionales considerables y conocimiento especializado. Aunque Meta cuenta con esos recursos, el uso ético del modelo y los problemas de sesgo siguen siendo factores importantes a considerar.
Aún no está claro cómo se diferenciará el modelo Llama 3 de Meta frente a otros modelos de código abierto, ni qué nuevas funciones o innovaciones ofrecerá. Esto podría convertirse en un tema de debate interesante dentro de la comunidad tecnológica.
El lanzamiento de modelos de código abierto impulsa la democratización de la tecnología y hace posible más innovación. Sin embargo, a medida que aumenta la influencia de estos modelos, también crecen las preocupaciones sobre la difusión de desinformación, la infracción de derechos de autor y los problemas de privacidad.

Meta lanzará la próxima semana versiones pequeñas de Llama 3

Ventajas y desventajas según el tamaño del modelo

Estado del desarrollo de los modelos Llama de Meta

Opinión de GN⁺

Lecturas relacionadas

Aún no hay comentarios.