13 puntos por xguru 2024-08-07 | 2 comentarios | Compartir por WhatsApp
  • En agosto de 2024 presentó EXAONE 3.0 y, tras usarlo solo de forma interna en LG, lo convirtió en un modelo abierto
  • Dentro de una línea configurada para distintos propósitos, se libera como open source para investigación el modelo 7.8B Instruction Tuned
  • Se espera que contribuya a investigaciones significativas de investigadores de IA dentro y fuera de Corea, así como al desarrollo del ecosistema de IA
  • Basado en una arquitectura Decoder-only Transformer, con 7.8B parámetros y 8T de datos de entrenamiento

Alcanza un nivel Global Top en inglés: 1er lugar en puntaje promedio en casos de uso del mundo real y rendimiento sobresaliente también en benchmarks individuales

  • El rendimiento en inglés del modelo 7.8B alcanza un nivel Global Top frente a otros modelos
  • Los resultados de evaluación en 4 benchmarks confirmaron un rendimiento superior al de modelos Global Top
  • Obtuvo el 1er lugar en puntaje promedio en Math y Coding, y también mostró alto rendimiento en Reasoning

Rendimiento en coreano claramente superior: 1er lugar en puntaje promedio tanto en casos de uso del mundo real como en benchmarks individuales

  • Como modelo bilingüe inglés/coreano, también ofrece un rendimiento sobresaliente en coreano
  • Para verificar el rendimiento desde la perspectiva de casos de uso del mundo real, se usaron 2 benchmarks
  • Los benchmarks individuales se configuraron para alinearse con benchmarks de evaluación en inglés como KMMLU
  • Se confirmó un resultado de 1er lugar en puntaje promedio tanto en casos de uso del mundo real como en benchmarks individuales

Eficiencia económica: tras 3 años de investigación y desarrollo, redujo los costos hasta un nivel del 6%

  • Para aprovechar la IA, además de mejorar el rendimiento, es indispensable fortalecer la eficiencia económica
  • Durante 3 años se concentraron en I+D de técnicas de aligeramiento de modelos de IA y en la optimización de costos
  • Frente a EXAONE 2.0, el modelo 7.8B redujo en 56% el tiempo de procesamiento de inferencia y en 72% los costos
  • Frente a EXAONE 1.0, logró reducir drásticamente el costo hasta un nivel del 6%

Transparencia ética: también se publican áreas que requieren mejoras, además de los buenos resultados

  • LG AI Research considera indispensable la ética de IA en el proceso de investigación y desarrollo de modelos de IA
  • El modelo EXAONE 3.0 7.8B también pasó por un proceso de Red Teaming para evaluar ética y seguridad
  • Se utilizaron datasets internos y externos de terceros para la evaluación
  • Muestra buenos resultados para prevenir discriminación de género o respuestas ilegales, aunque existen áreas por mejorar
  • Los resultados de evaluación se publican de forma transparente para contribuir al desarrollo de la ética de IA
  • Se espera una investigación activa de ética de IA por parte de la comunidad investigadora, y LG AI Research también continuará investigando

2 comentarios

 
[Este comentario fue ocultado.]
 
xguru 2024-08-07

Ojalá también tengamos cada vez más oportunidades de compartir noticias nacionales aquí ;)