La primera IA de política generalista de Physical Intelligence hace posible doblar ropa
(physicalintelligence.company)-
Inteligencia física (π)π0: nuestra primera política generalista
-
Vivimos en la era de la revolución de la IA, y aunque la IA puede resolver problemas "fáciles" como ganar una partida de ajedrez o descubrir nuevos medicamentos, los problemas del mundo físico, como doblar una camisa o limpiar una mesa, siguen siendo difíciles. Para resolver esto, es necesario dotar a los sistemas de IA de inteligencia física.
-
Durante los últimos 8 meses hemos desarrollado π0, un modelo base robótico generalista, que representa el primer paso para crear una inteligencia artificial a la que los usuarios puedan pedirle que haga las tareas que desean con un robot. π0 abarca imágenes, texto y acciones, y adquiere inteligencia física a través de la experiencia del robot.
-
La promesa de una política robótica generalista
-
Actualmente, los robots tienen una especialización limitada y no pueden actuar en entornos complejos. La IA puede simplificar la programación de nuevos comportamientos al permitir que los robots aprendan y sigan instrucciones de los usuarios. Para ello, se necesita una gran cantidad de datos.
-
Si se pudiera entrenar una política robótica generalista, sería posible crear un modelo capaz de realizar diversas habilidades y controlar distintos robots. Esto podría especializarse en nuevas tareas con una pequeña cantidad de datos.
-
Mezcla de entrenamiento entre implementaciones
-
π0 fue entrenado usando preentrenamiento de visión-lenguaje a escala de internet, conjuntos de datos open source de manipulación robótica y conjuntos de datos de tareas sofisticadas de 8 robots diferentes. Puede realizar diversas tareas, ya sea mediante prompts zero-shot o ajuste fino.
-
Herencia de comprensión semántica a escala de internet
-
π0 hereda conocimiento semántico y comprensión visual de un modelo de visión-lenguaje (VLM) preentrenado a escala de internet. El VLM fue entrenado para modelar texto e imágenes de la web.
-
Posentrenamiento para manipulación sofisticada
-
Las tareas complejas y sofisticadas pueden especializarse afinando el modelo. Por ejemplo, doblar la ropa para lavar es una tarea extremadamente difícil.
-
Evaluación y comparación de π0
-
En comparación con otros modelos base robóticos, π0 muestra un rendimiento sobresaliente en todas las tareas. También muestra un mejor rendimiento en comparación con π0-small.
-
Dirección futura
-
El objetivo de Physical Intelligence es desarrollar un modelo base capaz de controlar todos los robots. Los experimentos realizados hasta ahora muestran que puede controlar diversos robots y realizar tareas en las que antes no se había logrado tener éxito. Sin embargo, la política robótica generalista todavía se encuentra en una etapa temprana y aún requiere muchos avances en el futuro.
1 comentarios
Opiniones en Hacker News
Se menciona la necesidad de robots domésticos para la satisfacción humana
Visión escéptica sobre la practicidad de los robots
El problema de las limitaciones de espacio en las ciudades europeas
Posibilidad de los robots como herramientas de automatización de laboratorio
El potencial de los robots de cocina
El problema de la simplicidad y el costo de los robots
Cambios en el lavado de ropa
El problema de la velocidad de los robots