LG AI Research publica el modelo open source EXAONE 3.0 7.8B

xguru · 2024-08-07T11:20:02+09:00

En agosto de 2024 presentó EXAONE 3.0 y, tras usarlo solo de forma interna en LG, lo convirtió en un modelo abierto Dentro de una línea configurada para distintos propósitos, se libera como open source para investigación el modelo 7.8B Instruction Tuned Se espera que contribuya a investigaciones significativas de investigadores de IA dentro y fuera de Corea, así como al desarrollo del ecosistema de IA Basado en una arquitectura Decoder-only Transformer, con 7.8B parámetros y 8T de datos de entrenamiento Alcanza un nivel Global Top en inglés: 1er lugar en puntaje promedio en casos de uso del mundo real y rendimiento sobresaliente también en benchmarks individuales El rendimiento en inglés del modelo 7.8B alcanza un nivel Global Top frente a otros modelos Los resultados de evaluación en 4 benchmarks confirmaron un rendimiento superior al de modelos Global Top Obtuvo el 1er lugar en puntaje promedio en Math y Coding, y también mostró alto rendimiento en Reasoning Rendimiento en coreano claramente superior: 1er lugar en puntaje promedio tanto en casos de uso del mundo real como en benchmarks individuales Como modelo bilingüe inglés/coreano, también ofrece un rendimiento sobresaliente en coreano Para verificar el rendimiento desde la perspectiva de casos de uso del mundo real, se usaron 2 benchmarks Los benchmarks individuales se configuraron para alinearse con benchmarks de evaluación en inglés como KMMLU Se confirmó un resultado de 1er lugar en puntaje promedio tanto en casos de uso del mundo real como en benchmarks individuales Eficiencia económica: tras 3 años de investigación y desarrollo, redujo los costos hasta un nivel del 6% Para aprovechar la IA, además de mejorar el rendimiento, es indispensable fortalecer la eficiencia económica Durante 3 años se concentraron en I+D de técnicas de aligeramiento de modelos de IA y en la optimización de costos Frente a EXAONE 2.0, el modelo 7.8B redujo en 56% el tiempo de procesamiento de inferencia y en 72% los costos Frente a EXAONE 1.0, logró reducir drásticamente el costo hasta un nivel del 6% Transparencia ética: también se publican áreas que requieren mejoras, además de los buenos resultados LG AI Research considera indispensable la ética de IA en el proceso de investigación y desarrollo de modelos de IA El modelo EXAONE 3.0 7.8B también pasó por un proceso de Red Teaming para evaluar ética y seguridad Se utilizaron datasets internos y externos de terceros para la evaluación Muestra buenos resultados para prevenir discriminación de género o respuestas ilegales, aunque existen áreas por mejorar Los resultados de evaluación se publican de forma transparente para contribuir al desarrollo de la ética de IA Se espera una investigación activa de ética de IA por parte de la comunidad investigadora, y LG AI Research también continuará investigando

(lgresearch.ai)

13 puntos por xguru 2024-08-07 | 2 comentarios | Compartir por WhatsApp

En agosto de 2024 presentó EXAONE 3.0 y, tras usarlo solo de forma interna en LG, lo convirtió en un modelo abierto
Dentro de una línea configurada para distintos propósitos, se libera como open source para investigación el modelo 7.8B Instruction Tuned
Se espera que contribuya a investigaciones significativas de investigadores de IA dentro y fuera de Corea, así como al desarrollo del ecosistema de IA
Basado en una arquitectura Decoder-only Transformer, con 7.8B parámetros y 8T de datos de entrenamiento

Alcanza un nivel Global Top en inglés: 1er lugar en puntaje promedio en casos de uso del mundo real y rendimiento sobresaliente también en benchmarks individuales

El rendimiento en inglés del modelo 7.8B alcanza un nivel Global Top frente a otros modelos
Los resultados de evaluación en 4 benchmarks confirmaron un rendimiento superior al de modelos Global Top
Obtuvo el 1er lugar en puntaje promedio en Math y Coding, y también mostró alto rendimiento en Reasoning

Rendimiento en coreano claramente superior: 1er lugar en puntaje promedio tanto en casos de uso del mundo real como en benchmarks individuales

Como modelo bilingüe inglés/coreano, también ofrece un rendimiento sobresaliente en coreano
Para verificar el rendimiento desde la perspectiva de casos de uso del mundo real, se usaron 2 benchmarks
Los benchmarks individuales se configuraron para alinearse con benchmarks de evaluación en inglés como KMMLU
Se confirmó un resultado de 1er lugar en puntaje promedio tanto en casos de uso del mundo real como en benchmarks individuales

Eficiencia económica: tras 3 años de investigación y desarrollo, redujo los costos hasta un nivel del 6%

Para aprovechar la IA, además de mejorar el rendimiento, es indispensable fortalecer la eficiencia económica
Durante 3 años se concentraron en I+D de técnicas de aligeramiento de modelos de IA y en la optimización de costos
Frente a EXAONE 2.0, el modelo 7.8B redujo en 56% el tiempo de procesamiento de inferencia y en 72% los costos
Frente a EXAONE 1.0, logró reducir drásticamente el costo hasta un nivel del 6%

Transparencia ética: también se publican áreas que requieren mejoras, además de los buenos resultados

LG AI Research considera indispensable la ética de IA en el proceso de investigación y desarrollo de modelos de IA
El modelo EXAONE 3.0 7.8B también pasó por un proceso de Red Teaming para evaluar ética y seguridad
Se utilizaron datasets internos y externos de terceros para la evaluación
Muestra buenos resultados para prevenir discriminación de género o respuestas ilegales, aunque existen áreas por mejorar
Los resultados de evaluación se publican de forma transparente para contribuir al desarrollo de la ética de IA
Se espera una investigación activa de ética de IA por parte de la comunidad investigadora, y LG AI Research también continuará investigando

2 comentarios

2024-08-07

[Este comentario fue ocultado.]

xguru 2024-08-07

Ojalá también tengamos cada vez más oportunidades de compartir noticias nacionales aquí ;)