- Eureka usa un LLM (GPT-4) para generar automáticamente algoritmos de recompensa (código de software) que entrenan a los robots para realizar tareas complejas
- Entrena una mano robótica en la habilidad de "hacer girar un bolígrafo", similar a como lo hace una persona
- Además, Eureka enseña a los robots tareas como abrir cajones y gabinetes, lanzar y atrapar pelotas, y manipular tijeras
- No requiere prompts específicos por tarea ni plantillas de recompensa predefinidas, y puede integrar fácilmente retroalimentación humana
Aún no hay comentarios.