- Google DeepMind presentó RoboCat, que aprende por sí mismo mientras realiza varias tareas con un brazo robótico.
- Está basado en Gato ("gato" en español), un modelo multimodal que puede operar tanto en entornos reales como simulados.
- Para su auto-mejora, primero recopila datos reales sobre nuevas tareas.
- A partir de esos datos reales, ajusta finamente el modelo base para crear un agente derivado.
- El nuevo agente practica unas 10 mil veces para crear un conjunto de datos de entrenamiento.
- Integra los datos reales y los datos autogenerados en el conjunto de entrenamiento de RoboCat.
- Entrena una nueva versión de RoboCat.
- Con esto, puede adaptarse en pocas horas a nuevos brazos robóticos con más articulaciones o más pinzas.
- Además, se genera un círculo virtuoso de entrenamiento: el modelo inicial, que mostraba una tasa de éxito del 36% en una tarea específica, más que duplicó ese resultado hasta llegar al 74%.
3 comentarios
Por fin se abre el camino para que la inteligencia artificial conozca y experimente el mundo real.
Los comentarios del hilo de HN están muy graciosos.
Yo también pensé exactamente lo mismo:
¿Soy el único que esperaba un gato robot? Me deja un poco decepcionado...Estaría bueno que al menos le pegaran una calcomanía de gato al brazo robótico.
Al resumir el artículo, queda así.
RoboCat es un agente con auto-mejora para la manipulación robótica. Se entrena con un conjunto de datos grande y diverso de tareas robóticas usando múltiples simulaciones y brazos robóticos reales.
Los objetivos principales de RoboCat son los siguientes.
Los resultados principales son los siguientes.
En resumen, RoboCat, un agente con auto-mejora para la manipulación robótica entrenado con un conjunto de datos grande y diverso, demuestra que puede generalizar a nuevas tareas y robots con una cantidad mínima de datos mediante ajuste fino y auto-mejora. Su capacidad para aprovechar experiencia robótica heterogénea a gran escala tiene el potencial de transformar el aprendizaje robótico.