Más allá de A*: una mejor planificación con transformadores
- Los modelos de transformadores han logrado grandes avances en diversos campos de aplicación, pero se han quedado atrás frente a los métodos tradicionales de planificación simbólica a la hora de resolver tareas complejas de toma de decisiones.
- Los investigadores presentan una forma de entrenar transformadores para resolver tareas complejas de planificación y desarrollaron un modelo llamado Searchformer, que resuelve de forma óptima acertijos de Sokoban no vistos previamente en el 93.7% de los casos, usando hasta 26.8% menos pasos de búsqueda que la búsqueda A* convencional.
- Searchformer es un modelo transformador codificador-decodificador entrenado para predecir el comportamiento de búsqueda de A* y afinado mediante iteración experta, de modo que genera planes óptimos mientras realiza menos pasos de búsqueda que A*.
Método de entrenamiento y rendimiento
- En el método de entrenamiento, el comportamiento de búsqueda de A* se representa como una secuencia de tokens que indica cuándo se agregan y eliminan estados del árbol de búsqueda durante la planificación simbólica.
- En un estudio de ablación sobre navegación en laberintos, Searchformer supera ampliamente a un modelo base que predice directamente planes óptimos, con un tamaño de modelo entre 5 y 10 veces menor y un conjunto de entrenamiento 10 veces más pequeño.
- Los investigadores muestran que Searchformer también es eficaz para tareas de toma de decisiones más grandes y complejas, como Sokoban, al mejorar la proporción de problemas resueltos y acortar el comportamiento de búsqueda.
Opinión de GN⁺
- Esta investigación muestra una nueva posibilidad de uso para los modelos de transformadores en el campo de la inteligencia artificial. Al proponer un enfoque más eficiente que los métodos simbólicos tradicionales para resolver tareas complejas de toma de decisiones, representa un avance importante que amplía el alcance de aplicación de la IA.
- El modelo Searchformer demuestra una capacidad de resolución de problemas más rápida y eficiente usando menos recursos. Esto podría ser una gran ventaja, especialmente al implementar IA en entornos con recursos limitados.
- Este estudio sugiere que el avance de la tecnología de IA no depende únicamente de más datos y modelos más grandes, sino que también puede lograrse mediante metodologías inteligentes y mejoras algorítmicas. Es un enfoque muy interesante y valioso desde la perspectiva de la sostenibilidad y la eficiencia en la investigación en IA.
1 comentarios
Opiniones en Hacker News