Sandy - Lo hice porque me desesperaba que el agente de AI tuviera que pensar cada vez
(github.com/Sangkwun)Le puse un Sandevistan al agente de AI.
Si un agente de automatización es más lento que una persona, ¿realmente tiene sentido?
Me frustraba que se quedara pensando varios segundos con cada clic, así que me puse a pensarlo.
Las personas también, cuando repiten algo, terminan moviendo las manos antes de pensar. ¿No podría hacer lo mismo la AI?
🐢 Agente tradicional
Observe → inferencia del LLM (lenta) → Action → Observe → LLM... repetir
Se detiene a pensar en cada clic.
🐇 Sandy
- Primera ejecución: el LLM entiende el workflow → lo guarda como escenario
- Después: reproduce el escenario (sin llamadas al LLM)
Una vez que abre camino, corre sin dudar.
El LLM se usa solo la primera vez para encontrar el camino, y después ejecuta según el escenario guardado, así que puedes ganar velocidad y reducir costos al mismo tiempo.
Demo (buscar y reproducir un video de YouTube):
- Izquierda: agente normal (5x de velocidad)
- Derecha: Sandy (velocidad normal)
https://www.youtube.com/watch?v=nSKs8sy7o2c
Es útil en estos casos:
- Automatización de pruebas E2E
- Pruebas de regresión (ejecución determinística)
- Tareas que conectan varias herramientas (GitHub → notificación en Slack, etc.)
Es compatible con servidores MCP, así que puedes unir automatización de navegador + llamadas a API en un solo escenario.
GitHub: https://github.com/Sangkwun/sandy
Limitaciones honestas:
- Si cambia la UI, hay que volver a grabar el escenario
- Es más adecuado para tareas repetitivas que para exploración dinámica
Se agradecen preguntas o feedback. También estaré esperando PRs 😊
Aún no hay comentarios.