24 puntos por lemonmint 2025-03-19 | 9 comentarios | Compartir por WhatsApp
  • LG AI Research presentó EXAONE Deep, un nuevo modelo de IA de razonamiento
  • Un modelo de razonamiento de alto rendimiento, esencial para la transición hacia la era de la Agentic AI
  • Demostró capacidades de razonamiento sobresalientes en matemáticas, ciencia y programación
  • Características principales:
    • Matemáticas: rendimiento superior frente a modelos competidores en benchmarks matemáticos de alta dificultad (logrando un desempeño equivalente con un tamaño de modelo más pequeño)
    • Ciencia & programación: obtuvo el primer lugar en benchmarks clave (modelos 7.8B y 2.4B)
    • MMLU: logró el mejor rendimiento entre los modelos nacionales (modelo 32B)
  • Fue incluido en la lista de modelos de IA destacados de Epoch AI, validando su rendimiento (el segundo modelo EXAONE en ser incluido, después de EXAONE 3.5)

Rendimiento sobresaliente en matemáticas

  • Todos los modelos EXAONE Deep (32B, 7.8B, 2.4B) obtuvieron la puntuación más alta en la sección de matemáticas del examen nacional de admisión universitaria de 2025
  • EXAONE Deep 32B:
    • puntuó 94.5 en matemáticas del CSAT y 90.0 en AIME 2024
    • alcanzó un rendimiento equivalente al modelo DeepSeek-R1 (671B) en AIME 2025
    • mostró un desempeño especialmente sobresaliente en AIME, un benchmark de alta dificultad, demostrando eficiencia de entrenamiento y de costos
  • EXAONE Deep 7.8B & 2.4B:
    • ocuparon el primer lugar en benchmarks clave dentro de las categorías de modelos ligeros y on-device, respectivamente
    • modelo 7.8B: MATH-500 94.8, AIME 2025 59.6
    • modelo 2.4B: MATH-500 92.3, AIME 2024 47.9
  • Principales benchmarks de matemáticas:
    • CSAT (examen nacional de admisión universitaria)
    • AIME (American Invitational Mathematics Examination)
    • MATH-500

Experiencia destacada en ciencia y programación

  • También demostró un rendimiento superior al de modelos competidores en ciencia y programación
  • EXAONE Deep 32B:
    • 66.1 en la prueba GPQA Diamond (evalúa capacidad para resolver problemas científicos a nivel PhD)
    • 59.5 en LiveCodeBench (evalúa habilidades de programación), superando a modelos de IA de razonamiento de escala similar
    • sugiere un alto potencial de uso en áreas que requieren conocimiento especializado
  • EXAONE Deep 7.8B & 2.4B:
    • lograron el primer lugar en GPQA Diamond y LiveCodeBench
    • tras EXAONE 3.5 2.4B, se consolidan como modelos líderes globales en el segmento de modelos ligeros/on-device
  • Principales benchmarks de ciencia y programación:
    • GPQA Diamond
    • LiveCodeBench

9 comentarios

 
sice81 2025-03-20

Guau, apoyo a LG. ¿No es LLM casi lo mejor de nuestro país? Escuché que también lo aprovechan muy bien en sus sistemas internos... Pero la licencia deja algo que desear. Estaría bien que cuando salga una nueva versión, liberaran la anterior bajo MIT.

 
mindok 2025-03-19

El EXAONE 3.5 ya estaba bastante bien para ejecutarlo localmente en una laptop, así que tengo muchas expectativas.

 
bungker 2025-03-19

Me sorprendió muchísimo. Pensé que era puro humo mediático, pero que incluso la conservadora LG sacara algo así y hasta lo publicara...

 
halfenif 2025-03-20

Me pregunto cómo se podrá usar según la licencia que revisé.

  1. Restrictions
    3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
    any commercial purposes, including but not limited to, developing or deploying products, services, or
    applications that generate revenue, whether directly or indirectly.

3.1 Uso comercial: Se prohíbe expresamente al licenciatario usar el Modelo, los Derivados o los Resultados con fines comerciales, incluyendo, entre otros, desarrollar o desplegar productos, servicios o aplicaciones que generen ingresos, ya sea de forma directa o indirecta.

  1. Ownership
    4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
    whether in its original form or modified, are and shall remain the exclusive property of the Licensor.

4.2 Resultados: Todos los derechos, títulos e intereses sobre los Resultados generados por el Modelo y los Derivados, ya sea en su forma original o modificada, son y seguirán siendo propiedad exclusiva del licenciador.

 
yosemite 2025-03-20

Sí. Es una licencia que no permite el uso comercial. Por eso, yo la descarto de mis opciones.

 
junia3 2025-03-19

Lo instalé en el servidor y lo probé, pero comparado con qwq, el tiempo de think se alarga demasiado.
No sé si acierta bien las respuestas, pero la latencia se siente más fuerte de lo que esperaba.

 
junia3 2025-03-19

Entonces, era así solo para algunos problemas. Probé ejecutando algunos más para comparar y parece que dan resultados similares.

 
nowdoit7 2025-03-19

¡Te apoyamos! ¡LG, vamos!

 
jujumilk3 2025-03-19

Los apoyo. Estoy dando Me gusta en todos los lugares donde lo veo en LinkedIn.