¿Qué tan rápido aprenden habilidades inesperadas los modelos de lenguaje grandes?
- Una nueva investigación sobre las capacidades de los modelos de lenguaje grandes (Large Language Models, LLMs) sugiere que las llamadas 'capacidades de aceleración repentina' en realidad se desarrollan de forma gradual y predecible.
- Los investigadores describieron estas capacidades como un comportamiento de 'aceleración repentina', comparándolo con una transición de fase en física, similar a cuando un líquido se convierte en hielo.
- Sin embargo, un equipo de investigación de la Universidad de Stanford sostiene que la aparición repentina de estas capacidades es solo el resultado de la manera en que los investigadores miden el desempeño de los LLM.
Medición del desempeño de los modelos de lenguaje grandes
- Los modelos de lenguaje grandes analizan enormes conjuntos de datos de texto para encontrar conexiones entre palabras que aparecen juntas con frecuencia.
- El tamaño del modelo se mide por la cantidad de parámetros, y mientras más parámetros tenga, más conexiones puede encontrar un LLM.
- GPT-2 tenía 1,500 millones de parámetros, GPT-3.5 350,000 millones y GPT-4 utiliza 1.75 billones de parámetros.
Desarrollo gradual de capacidades inesperadas
- El equipo de Stanford afirma que las capacidades de los LLM no aparecen de forma súbita e impredecible, sino gradual y predeciblemente.
- Por ejemplo, en la suma de números de tres cifras, GPT-3 y LaMDA fallaban al calcular correctamente cuando tenían menos parámetros, pero a medida que aumentaban los parámetros, de pronto parecían poder hacer sumas.
- En lugar de evaluar los LLM solo por exactitud, los investigadores usaron una medición que otorga puntaje parcial y descubrieron que los LLM iban prediciendo gradualmente el orden correcto de los números.
Opiniones de otros científicos
- Otros científicos señalan que este estudio no resuelve por completo el concepto de 'aceleración repentina'.
- Sigue siendo incierto qué criterios de medición usar o cómo predecir cuándo el desempeño de un LLM mejorará bruscamente.
- Algunos científicos sostienen que los reportes previos sobre 'aceleración repentina' eran correctos y subrayan que, para capacidades como la aritmética, la respuesta correcta lo es todo.
Opinión de GN⁺
- Este estudio podría tener implicaciones importantes para el debate sobre la seguridad y los riesgos potenciales de la inteligencia artificial. Si las capacidades de los LLM se desarrollan de manera predecible, eso podría convertirse en un indicador importante para el desarrollo y la gestión segura de la IA.
- Cuando estos resultados se apliquen al desarrollo real de IA, será necesario que los desarrolladores reconozcan la importancia de cómo se mide el desempeño y diseñen métodos de evaluación más sofisticados.
- Este artículo puede ayudar a entender los cambios y avances que ocurren en la frontera de la investigación en IA, especialmente al ofrecer una nueva perspectiva sobre cómo se evalúa el desempeño de los modelos de IA.
- Desde una mirada crítica, hay que reconocer que los resultados no explican todas las mejoras de desempeño de los LLM y que, en modelos más grandes y complejos, el fenómeno de la 'aceleración repentina' todavía podría ocurrir.
- En relación con esta tecnología, la serie GPT de OpenAI ya se usa ampliamente en el mercado, y este estudio podría inspirar el desarrollo de otros LLM similares a GPT.
1 comentarios
Opiniones de Hacker News
Algunos problemas relacionados con el estudio
La dificultad de predecir el futuro
Cómo cambian los resultados al modificar el criterio de medición
Título del artículo: "Are Emergent Abilities of Large Language Models a Mirage?"
Observaciones sobre cambios abruptos en las capacidades
Enfoque de puntaje parcial y entrenamiento del modelo
Aparición gradual de las capacidades
Limitaciones de los modelos de lenguaje grandes (Large Language Models, LLMs)
Confusión sobre el criterio de medición
edit distance) podría no ser adecuado.