RoboCat - agente robótico con auto-mejora

kuroneko · 2023-06-21T10:24:42+09:00

Google DeepMind presentó RoboCat, que aprende por sí mismo mientras realiza varias tareas con un brazo robótico. Está basado en Gato ("gato" en español), un modelo multimodal que puede operar tanto en entornos reales como simulados. Para su auto-mejora, primero recopila datos reales sobre nuevas tareas. A partir de esos datos reales, ajusta finamente el modelo base para crear un agente derivado. El nuevo agente practica unas 10 mil veces para crear un conjunto de datos de entrenamiento. Integra los datos reales y los datos autogenerados en el conjunto de entrenamiento de RoboCat. Entrena una nueva versión de RoboCat. Con esto, puede adaptarse en pocas horas a nuevos brazos robóticos con más articulaciones o más pinzas. Además, se genera un círculo virtuoso de entrenamiento: el modelo inicial, que mostraba una tasa de éxito del 36% en una tarea específica, más que duplicó ese resultado hasta llegar al 74%.

(deepmind.com)

10 puntos por kuroneko 2023-06-21 | 3 comentarios | Compartir por WhatsApp

Google DeepMind presentó RoboCat, que aprende por sí mismo mientras realiza varias tareas con un brazo robótico.
Está basado en Gato ("gato" en español), un modelo multimodal que puede operar tanto en entornos reales como simulados.
- Para su auto-mejora, primero recopila datos reales sobre nuevas tareas.
- A partir de esos datos reales, ajusta finamente el modelo base para crear un agente derivado.
- El nuevo agente practica unas 10 mil veces para crear un conjunto de datos de entrenamiento.
- Integra los datos reales y los datos autogenerados en el conjunto de entrenamiento de RoboCat.
- Entrena una nueva versión de RoboCat.
Con esto, puede adaptarse en pocas horas a nuevos brazos robóticos con más articulaciones o más pinzas.
Además, se genera un círculo virtuoso de entrenamiento: el modelo inicial, que mostraba una tasa de éxito del 36% en una tarea específica, más que duplicó ese resultado hasta llegar al 74%.

3 comentarios

nicewook 2023-06-21

Por fin se abre el camino para que la inteligencia artificial conozca y experimente el mundo real.

kuroneko 2023-06-21

Los comentarios del hilo de HN están muy graciosos.
Yo también pensé exactamente lo mismo: ¿Soy el único que esperaba un gato robot? Me deja un poco decepcionado...

Estaría bueno que al menos le pegaran una calcomanía de gato al brazo robótico.

kuroneko 2023-06-21

Al resumir el artículo, queda así.

RoboCat es un agente con auto-mejora para la manipulación robótica. Se entrena con un conjunto de datos grande y diverso de tareas robóticas usando múltiples simulaciones y brazos robóticos reales.

Los objetivos principales de RoboCat son los siguientes.

Generalizar a nuevas tareas y robots con una cantidad mínima de datos. RoboCat puede adaptarse a nuevas tareas y robots usando solo entre 100 y 1000 ejemplos de demostración.
Mejorarse a sí mismo mediante un proceso iterativo. El modelo RoboCat ajustado finamente se usa para generar más datos de entrenamiento, y estos datos se agregan al conjunto de entrenamiento para mejorar el agente general.
Manejar múltiples implementaciones con distintas tareas y espacios de observación. RoboCat se prueba en brazos con hasta 14 grados de libertad y diferentes grippers.
Resolver diversas tareas de manipulación diestra usando objetos de distintas formas, tamaños y texturas. Las tareas incluyen apilar, insertar y levantar, entre otras.

Los resultados principales son los siguientes.

A medida que los datos de entrenamiento de RoboCat aumentan y se diversifican, la transferencia entre tareas mejora y la adaptación a nuevas tareas se vuelve más eficiente.
RoboCat puede adaptarse con éxito a nuevas tareas y robots usando solo una pequeña cantidad de datos de demostración, y requiere menos esfuerzo de aprendizaje en comparación con las líneas base.
Al ampliar los datos de entrenamiento mediante auto-mejora, RoboCat tiene un mejor desempeño en las tareas originales de entrenamiento y se ajusta finamente.

En resumen, RoboCat, un agente con auto-mejora para la manipulación robótica entrenado con un conjunto de datos grande y diverso, demuestra que puede generalizar a nuevas tareas y robots con una cantidad mínima de datos mediante ajuste fino y auto-mejora. Su capacidad para aprovechar experiencia robótica heterogénea a gran escala tiene el potencial de transformar el aprendizaje robótico.

RoboCat - agente robótico con auto-mejora

Lecturas relacionadas

3 comentarios