2 puntos por baeba 2025-05-07 | Aún no hay comentarios. | Compartir por WhatsApp
  1. El equipo de DeepMind anunció que un agente de tenis de mesa robótico alcanzó un nivel de juego comparable al de humanos aficionados mediante el uso de una arquitectura de políticas jerárquicas y técnicas de adaptación en tiempo real.
  2. Este robot fue validado mediante transferencia simulación-a-realidad en cero disparos (sim-to-real), adaptación en juego real y pruebas de partido contra oponentes humanos reales.
  3. Como resultado, mostró una tasa de victorias del 100% contra principiantes y del 55% contra jugadores intermedios, demostrando un nivel de juego claramente equivalente al de un humano intermedio.

1. Antecedentes y aportes de la investigación

  • El tenis de mesa es un deporte complejo que exige al mismo tiempo estrategia y control motor de alta velocidad, por lo que representa un desafío de nivel humano para la robótica.

  • Los estudios previos se habían limitado a rallies simples, y este estudio es el primero en lograr juego competitivo real contra humanos.

  • Los aportes de esta investigación son los siguientes:

    • Arquitectura de políticas jerárquicas (HLC + LLC)
    • Técnica de transferencia sim-to-real en cero disparos
    • Sistema de adaptación al oponente en tiempo real
    • Experimento de evaluación con usuarios mediante 29 jugadores humanos reales

2. Configuración del sistema y método de entrenamiento

  • El controlador inferior (LLC) cuenta con políticas especializadas en habilidades concretas (derecha, revés, saque, etc.) y con descriptores de habilidad (skill descriptor).
  • El controlador superior (HLC) selecciona la habilidad adecuada considerando la situación del partido, las estadísticas del oponente y las características de cada LLC.
  • El proceso de entrenamiento avanza en el orden datos humanos iniciales → simulación → aplicación en juego real → aprendizaje iterativo, formando así una estructura de aprendizaje curricular automática.

3. Evaluación de desempeño y análisis de limitaciones

  • Partidos contra un total de 29 jugadores humanos de distintos niveles:

    • Principiantes: 100% de victorias
    • Intermedios: 55% de victorias
    • Avanzados o superiores: 0 victorias
      → Tasa de victoria total: 45% (por partido), 46% (por set)
  • En la evaluación cualitativa, los participantes lo calificaron como “divertido e inmersivo”, y jugaron voluntariamente más de 4 de 5 minutos en promedio.

  • Desventajas:

    • Manejo deficiente del underspin
    • Dificultad para responder a pelotas bajas
      → Esto se debe a la dificultad de evitar colisiones con la mesa y de estimar el giro, y queda como tarea de mejora futura

Aún no hay comentarios.

Aún no hay comentarios.