Investigadores del MIT demuestran una técnica de exploración del conocimiento en modelos de lenguaje a gran escala
- Descubrieron que, cuando los modelos de lenguaje a gran escala responden a los prompts de los usuarios, utilizan un mecanismo simple para recuperar el conocimiento almacenado.
- Los investigadores pueden aprovechar este mecanismo simple para identificar lo que el modelo sabe sobre diversos temas y corregir información almacenada de forma incorrecta.
La complejidad de los modelos de lenguaje a gran escala
- Los modelos de lenguaje a gran escala se usan en una amplia variedad de áreas, como soporte al cliente, generación de código y traducción de idiomas, pero su funcionamiento no se comprende por completo.
- Investigadores del MIT y de otras instituciones estudiaron el mecanismo mediante el cual estos enormes modelos de aprendizaje automático recuperan conocimiento almacenado.
Un mecanismo simple de recuperación del conocimiento
- Los resultados de la investigación muestran que los modelos de lenguaje a gran escala a menudo usan una función lineal simple para recuperar y decodificar hechos almacenados.
- El modelo utiliza la misma función de decodificación para tipos similares de hechos.
- Una función lineal es una ecuación que representa una relación directa entre dos variables.
Explorar lo que sabe el modelo
- Al identificar funciones lineales para distintos hechos, los investigadores exploraron lo que el modelo sabe sobre nuevos temas y verificaron en qué parte del modelo está almacenado ese conocimiento.
- Usando la técnica desarrollada y las funciones simples estimadas, descubrieron que incluso cuando el modelo da respuestas incorrectas, con frecuencia sigue almacenando la información correcta.
Visualización del conocimiento del modelo
- Los investigadores usaron estas funciones para determinar qué considera verdadero el modelo sobre distintos temas.
- Por ejemplo, comenzando con el prompt "Bill Bradley was a" y usando funciones de decodificación para "plays sports" y "attended university", comprobaron si el modelo sabe que Sen. Bradley fue jugador de baloncesto y asistió a Princeton University.
- Con esta técnica de exploración, crearon una cuadrícula llamada 'attribute lens' para visualizar en qué parte de las múltiples capas del transformer se almacena la información sobre relaciones específicas.
Opinión de GN⁺
- Esta investigación lleva un paso más allá la comprensión de cómo los modelos de lenguaje a gran escala almacenan y recuperan conocimiento factual.
- También plantea la posibilidad de usar estos hallazgos para corregir conocimiento y evitar errores en chatbots de IA, con el fin de reducir la tendencia del modelo a entregar información incorrecta.
- Si esta técnica se aplica, podría contribuir a mejorar la confiabilidad de la IA y ayudar a mejorar la experiencia del usuario.
- Sin embargo, dado que no todos los hechos están codificados de forma lineal, se necesita más investigación para saber si esta técnica puede aplicarse a todo tipo de recuperación de conocimiento.
- Entre los proyectos de código abierto con funciones similares se encuentran BERT de Google y la serie GPT de OpenAI, que también han contribuido a comprender cómo funcionan los modelos de lenguaje a gran escala.
- Al introducir nuevas tecnologías, es necesario considerar el equilibrio entre la complejidad del modelo y su interpretabilidad, y uno de los beneficios de elegir esta técnica sería mejorar la precisión y la confiabilidad del modelo.
1 comentarios
Comentarios en Hacker News
Este trabajo sorprendente resalta algunos de los mayores problemas actuales en el campo de la IA
La estructura del lenguaje hace posible Word2Vec
Ayuda a entender lo que implica que los hechos se almacenen como funciones lineales
Curiosidad sobre el tipo de funciones usadas para codificar conocimiento de programación
Encuentra similitudes con lo que hacen los vectores de relación en Word2Vec
Los LLM parecen ser un buen mecanismo de compresión
Recuerda el ejemplo de embedding "King - Man + Woman = Queen"
Es difícil entender cómo un "archivo CSV/base de datos/modelo" con 7 mil millones de "parámetros" puede ofrecer un LLM/GPT interactivo y conocedor sobre casi cualquier tema
Le gusta que este paper sea genial y que haya hecho experimentos para validar estas ideas
La posibilidad de separar la parte de razonamiento de la parte de información