Sandy - Lo hice porque me desesperaba que el agente de AI tuviera que pensar cada vez

Le puse un Sandevistan al agente de AI.

Si un agente de automatización es más lento que una persona, ¿realmente tiene sentido?
Me frustraba que se quedara pensando varios segundos con cada clic, así que me puse a pensarlo.
Las personas también, cuando repiten algo, terminan moviendo las manos antes de pensar. ¿No podría hacer lo mismo la AI?

🐢 Agente tradicional
Observe → inferencia del LLM (lenta) → Action → Observe → LLM... repetir
Se detiene a pensar en cada clic.

🐇 Sandy

Primera ejecución: el LLM entiende el workflow → lo guarda como escenario
Después: reproduce el escenario (sin llamadas al LLM)
Una vez que abre camino, corre sin dudar.

El LLM se usa solo la primera vez para encontrar el camino, y después ejecuta según el escenario guardado, así que puedes ganar velocidad y reducir costos al mismo tiempo.

Demo (buscar y reproducir un video de YouTube):

Izquierda: agente normal (5x de velocidad)
Derecha: Sandy (velocidad normal)
https://www.youtube.com/watch?v=nSKs8sy7o2c

Es útil en estos casos:

Automatización de pruebas E2E
Pruebas de regresión (ejecución determinística)
Tareas que conectan varias herramientas (GitHub → notificación en Slack, etc.)

Es compatible con servidores MCP, así que puedes unir automatización de navegador + llamadas a API en un solo escenario.

GitHub: https://github.com/Sangkwun/sandy

Limitaciones honestas:

Si cambia la UI, hay que volver a grabar el escenario
Es más adecuado para tareas repetitivas que para exploración dinámica

Se agradecen preguntas o feedback. También estaré esperando PRs 😊

Sandy - Lo hice porque me desesperaba que el agente de AI tuviera que pensar cada vez

Lecturas relacionadas

Aún no hay comentarios.