- En agosto de 2024 presentó EXAONE 3.0 y, tras usarlo solo de forma interna en LG, lo convirtió en un modelo abierto
- Dentro de una línea configurada para distintos propósitos, se libera como open source para investigación el modelo 7.8B Instruction Tuned
- Se espera que contribuya a investigaciones significativas de investigadores de IA dentro y fuera de Corea, así como al desarrollo del ecosistema de IA
- Basado en una arquitectura Decoder-only Transformer, con 7.8B parámetros y 8T de datos de entrenamiento
Alcanza un nivel Global Top en inglés: 1er lugar en puntaje promedio en casos de uso del mundo real y rendimiento sobresaliente también en benchmarks individuales
- El rendimiento en inglés del modelo 7.8B alcanza un nivel Global Top frente a otros modelos
- Los resultados de evaluación en 4 benchmarks confirmaron un rendimiento superior al de modelos Global Top
- Obtuvo el 1er lugar en puntaje promedio en Math y Coding, y también mostró alto rendimiento en Reasoning
Rendimiento en coreano claramente superior: 1er lugar en puntaje promedio tanto en casos de uso del mundo real como en benchmarks individuales
- Como modelo bilingüe inglés/coreano, también ofrece un rendimiento sobresaliente en coreano
- Para verificar el rendimiento desde la perspectiva de casos de uso del mundo real, se usaron 2 benchmarks
- Los benchmarks individuales se configuraron para alinearse con benchmarks de evaluación en inglés como KMMLU
- Se confirmó un resultado de 1er lugar en puntaje promedio tanto en casos de uso del mundo real como en benchmarks individuales
Eficiencia económica: tras 3 años de investigación y desarrollo, redujo los costos hasta un nivel del 6%
- Para aprovechar la IA, además de mejorar el rendimiento, es indispensable fortalecer la eficiencia económica
- Durante 3 años se concentraron en I+D de técnicas de aligeramiento de modelos de IA y en la optimización de costos
- Frente a EXAONE 2.0, el modelo 7.8B redujo en 56% el tiempo de procesamiento de inferencia y en 72% los costos
- Frente a EXAONE 1.0, logró reducir drásticamente el costo hasta un nivel del 6%
Transparencia ética: también se publican áreas que requieren mejoras, además de los buenos resultados
- LG AI Research considera indispensable la ética de IA en el proceso de investigación y desarrollo de modelos de IA
- El modelo EXAONE 3.0 7.8B también pasó por un proceso de Red Teaming para evaluar ética y seguridad
- Se utilizaron datasets internos y externos de terceros para la evaluación
- Muestra buenos resultados para prevenir discriminación de género o respuestas ilegales, aunque existen áreas por mejorar
- Los resultados de evaluación se publican de forma transparente para contribuir al desarrollo de la ética de IA
- Se espera una investigación activa de ética de IA por parte de la comunidad investigadora, y LG AI Research también continuará investigando
2 comentarios
Ojalá también tengamos cada vez más oportunidades de compartir noticias nacionales aquí ;)