10 puntos por kuroneko 2023-06-21 | 3 comentarios | Compartir por WhatsApp
  • Google DeepMind presentó RoboCat, que aprende por sí mismo mientras realiza varias tareas con un brazo robótico.
  • Está basado en Gato ("gato" en español), un modelo multimodal que puede operar tanto en entornos reales como simulados.
    • Para su auto-mejora, primero recopila datos reales sobre nuevas tareas.
    • A partir de esos datos reales, ajusta finamente el modelo base para crear un agente derivado.
    • El nuevo agente practica unas 10 mil veces para crear un conjunto de datos de entrenamiento.
    • Integra los datos reales y los datos autogenerados en el conjunto de entrenamiento de RoboCat.
    • Entrena una nueva versión de RoboCat.
  • Con esto, puede adaptarse en pocas horas a nuevos brazos robóticos con más articulaciones o más pinzas.
  • Además, se genera un círculo virtuoso de entrenamiento: el modelo inicial, que mostraba una tasa de éxito del 36% en una tarea específica, más que duplicó ese resultado hasta llegar al 74%.

3 comentarios

 
nicewook 2023-06-21

Por fin se abre el camino para que la inteligencia artificial conozca y experimente el mundo real.

 
kuroneko 2023-06-21

Los comentarios del hilo de HN están muy graciosos.
Yo también pensé exactamente lo mismo: ¿Soy el único que esperaba un gato robot? Me deja un poco decepcionado...

Estaría bueno que al menos le pegaran una calcomanía de gato al brazo robótico.

 
kuroneko 2023-06-21

Al resumir el artículo, queda así.

RoboCat es un agente con auto-mejora para la manipulación robótica. Se entrena con un conjunto de datos grande y diverso de tareas robóticas usando múltiples simulaciones y brazos robóticos reales.

Los objetivos principales de RoboCat son los siguientes.

  1. Generalizar a nuevas tareas y robots con una cantidad mínima de datos. RoboCat puede adaptarse a nuevas tareas y robots usando solo entre 100 y 1000 ejemplos de demostración.
  2. Mejorarse a sí mismo mediante un proceso iterativo. El modelo RoboCat ajustado finamente se usa para generar más datos de entrenamiento, y estos datos se agregan al conjunto de entrenamiento para mejorar el agente general.
  3. Manejar múltiples implementaciones con distintas tareas y espacios de observación. RoboCat se prueba en brazos con hasta 14 grados de libertad y diferentes grippers.
  4. Resolver diversas tareas de manipulación diestra usando objetos de distintas formas, tamaños y texturas. Las tareas incluyen apilar, insertar y levantar, entre otras.

Los resultados principales son los siguientes.

  • A medida que los datos de entrenamiento de RoboCat aumentan y se diversifican, la transferencia entre tareas mejora y la adaptación a nuevas tareas se vuelve más eficiente.
  • RoboCat puede adaptarse con éxito a nuevas tareas y robots usando solo una pequeña cantidad de datos de demostración, y requiere menos esfuerzo de aprendizaje en comparación con las líneas base.
  • Al ampliar los datos de entrenamiento mediante auto-mejora, RoboCat tiene un mejor desempeño en las tareas originales de entrenamiento y se ajusta finamente.

En resumen, RoboCat, un agente con auto-mejora para la manipulación robótica entrenado con un conjunto de datos grande y diverso, demuestra que puede generalizar a nuevas tareas y robots con una cantidad mínima de datos mediante ajuste fino y auto-mejora. Su capacidad para aprovechar experiencia robótica heterogénea a gran escala tiene el potencial de transformar el aprendizaje robótico.