- DeepMind presentó Scalable Instructable Multiworld Agent (SIMA)
- Google DeepMind tiene una larga trayectoria en IA y videojuegos, desde juegos de Atari hasta el sistema AlphaStar que juega StarCraft II al nivel de un gran maestro humano
- SIMA es un agente de IA generalista para entornos virtuales 3D, capaz de seguir instrucciones en lenguaje natural en distintos entornos de videojuegos
- Esta investigación busca cambiar el enfoque de juegos individuales hacia agentes de IA de juego general e instruible
- Fue entrenado en varios videojuegos en colaboración con distintos desarrolladores de juegos
- Muestra por primera vez que un agente de IA puede comprender mundos de juego amplios y realizar tareas dentro de ellos siguiendo instrucciones en lenguaje natural
Aprender en los videojuegos
- SIMA fue entrenado y evaluado en 9 videojuegos diferentes, incluidos No Man’s Sky de Hello Games y Teardown de Tuxedo Labs
- Para exponerlo a entornos diversos, colaboraron con desarrolladores de juegos y establecieron alianzas con 8 estudios de videojuegos
- SIMA aprendió distintas habilidades, desde exploración simple y uso de menús hasta extracción de recursos, pilotaje de naves espaciales y fabricación de cascos
- También se usó en 4 entornos de investigación, incluido Construction Lab, un nuevo entorno construido con Unity
SIMA: un agente de IA versátil
- SIMA es un agente de IA que puede percibir y comprender distintos entornos, y luego realizar acciones para alcanzar los objetivos indicados
- Incluye un modelo para un mapeo preciso entre imagen y lenguaje, y un modelo de video que predice lo que ocurrirá después en pantalla
- No necesita acceso al código fuente del juego ni a APIs específicas; solo requiere imágenes de pantalla e instrucciones simples en lenguaje natural proporcionadas por el usuario
- SIMA ejecuta estas instrucciones controlando al personaje principal del juego mediante salidas de teclado y mouse
Generalización en juegos y otros entornos
- Los agentes entrenados en múltiples juegos mostraron mejor desempeño que los entrenados en un solo juego
- Se necesita más investigación para lograr un rendimiento a nivel humano no solo en los entornos de entrenamiento, sino también en entornos no vistos
- El desempeño de SIMA depende del lenguaje; sin entrenamiento lingüístico o sin instrucciones, actúa de forma adecuada pero sin un propósito claro
Avances en la investigación de agentes de IA
- Los resultados de SIMA muestran el potencial del desarrollo de agentes de IA generales basados en lenguaje
- Como investigación en etapa inicial, se espera seguir desarrollando SIMA integrando más entornos de entrenamiento y modelos más capaces
- El objetivo final es construir sistemas y agentes de IA generales que puedan comprender y realizar de forma segura diversas tareas útiles para las personas, tanto en línea como en el mundo real
Opinión de GN⁺
- SIMA es una investigación importante que muestra la capacidad de la IA para comprender instrucciones y actuar de manera similar a los humanos en diversos entornos
- Este tipo de investigación podría abrir el camino a un futuro en el que la IA vaya más allá de tareas simples y pueda realizar planificación estratégica compleja y multitarea
- Sin embargo, aún se necesita mucha investigación y desarrollo para que la IA alcance un rendimiento a nivel humano
- Hace falta discutir cómo esta tecnología puede aplicarse para resolver problemas del mundo real y qué límites potenciales podría tener la capacidad de generalización de la IA
- Otro proyecto de IA con funciones similares es OpenAI Gym, una plataforma de IA que puede aprender en diversos videojuegos
1 comentarios
Comentarios en Hacker News