24 puntos por princox 2026-02-19 | 1 comentarios | Compartir por WhatsApp

https://github.com/unitedbyai/droidclaw
Es un framework de agente de IA móvil que, al ingresar un objetivo en lenguaje natural, reconoce la pantalla y ejecuta automáticamente toques y entradas a través de ADB.

Su funcionamiento es simple. Repite en bucle “captura de pantalla → reconocimiento con modelo de visión → inferencia de la siguiente acción → ejecución por ADB”. Por ejemplo, si escribes “busca Claude en YouTube”, automatiza desde abrir la app hasta ingresar el término de búsqueda.

La diferencia frente a las herramientas RPA existentes es que funciona entendiendo la pantalla sin hardcodear coordenadas. Incluso si cambia la UI, puede adaptarse hasta cierto punto.

Escenarios de uso posibles:
∙ automatización de pruebas de UI de apps
∙ conectar varios teléfonos en paralelo para distribuir tareas repetitivas
∙ automatización que requiere dispositivos físicos (casos que no funcionan con emulador)

Si tienes por ahí un teléfono guardado en un cajón, puedes probarlo fácilmente. Solo necesitas conexión ADB.

1 comentarios

 
vigorous5537 2026-02-19

Es una buena idea.