RUNE-BOT: agente de IA local que aprende reglas a partir de los fracasos
(github.com/dybala-21)Estoy creando rune, un asistente de IA de propósito general que corre en local.
La idea central no es un "agente que acumula memoria", sino una arquitectura self-improving que generaliza los fracasos como reglas y ajusta su propio comportamiento mientras valida esas reglas en tareas reales.
Self-Improving: crea reglas a partir de los fracasos y las vuelve a validar
ejecución → registro → detección de repetición de fallos → generación de candidatos de reglas → validación en tareas relacionadas → promoción o descarte
Cuando el agente repite el mismo tipo de fallo, convierte ese patrón en un candidato de regla preventiva. Esa regla no se mete de inmediato en el prompt. Empieza con baja confianza y después solo se rastrean sus resultados en tareas relacionadas. Solo las reglas útiles se promueven gradualmente, y las que no funcionan pierden puntos más rápido hasta desaparecer.
Todas las tareas se guardan como episodes y queda registrado si tuvieron éxito o fracaso. Cuando hace un trabajo parecido, recupera episodes anteriores como referencia.
Proactive: se mueve antes de que se lo pidan
Hace sugerencias antes de que el usuario las pida. Si detecta señales de frustración en el flujo de trabajo —fallos repetidos, cancelaciones rápidas, acumulación de errores— propone ayuda, y si detecta un patrón de fallos repetidos genera automáticamente una regla preventiva.
Aun así, no interrumpe sin sentido. Si el usuario rechaza una sugerencia, ese feedback se rastrea. Si la rechazan 5 veces en 30 minutos, reduce automáticamente la frecuencia de intervención y sube el umbral para hacer sugerencias. El propio sistema proactivo se ajusta por sí mismo según la reacción del usuario.
Cosas que el agente puede hacer
- Leer/escribir/editar/buscar archivos, ejecutar comandos de shell
- Automatización del navegador — navegar por páginas, hacer clic, escribir, tomar screenshots, extraer texto
- Búsqueda web (DuckDuckGo/Brave) y scraping de URLs
- Análisis de código — seguimiento de símbolos basado en tree-sitter, búsqueda de definiciones/referencias, análisis de impacto de cambios
- Delegación a subagentes — divide tareas complejas para ejecutarlas en paralelo
- Ejecución programada basada en cron
- Integración con servidores MCP — descubre y ejecuta herramientas externas automáticamente
- Skills personalizadas — el usuario puede crear y registrar herramientas directamente
Seguridad
Guardian bloquea primero las acciones peligrosas, Completion/Evidence Gate verifica "si de verdad leyó, escribió y validó", y Quality Gate filtra respuestas de éxito vacías o el ocultamiento de errores. El sistema de seguridad no es fail-open, sino fail-closed.
Local-first
Toda la memoria de largo plazo tiene como source of truth archivos markdown. SQLite y FAISS son solo cachés de búsqueda, y se pueden reconstruir desde markdown en cualquier momento. Se pueden abrir directamente, modificar y versionar con git.
Interfaz
- CLI + terminal UI basada en Rich
- Multicanal: Telegram, Discord, Slack, LINE, WhatsApp, Google Chat, Mattermost
- Web
El stack tecnológico es Python 3.13+, litellm, APSW(WAL), FAISS HNSW, tree-sitter y structlog. A través de litellm, se puede conectar cualquier LLM sin quedar atado a un proveedor de modelos específico.
Aún no hay comentarios.