RUNE-BOT: agente de IA local que aprende reglas a partir de los fracasos

(github.com/dybala-21)

2 puntos por dybala21 2026-03-27 | Aún no hay comentarios. | Compartir por WhatsApp

Estoy creando rune, un asistente de IA de propósito general que corre en local.

La idea central no es un "agente que acumula memoria", sino una arquitectura self-improving que generaliza los fracasos como reglas y ajusta su propio comportamiento mientras valida esas reglas en tareas reales.

Self-Improving: crea reglas a partir de los fracasos y las vuelve a validar

ejecución → registro → detección de repetición de fallos → generación de candidatos de reglas → validación en tareas relacionadas → promoción o descarte

Cuando el agente repite el mismo tipo de fallo, convierte ese patrón en un candidato de regla preventiva. Esa regla no se mete de inmediato en el prompt. Empieza con baja confianza y después solo se rastrean sus resultados en tareas relacionadas. Solo las reglas útiles se promueven gradualmente, y las que no funcionan pierden puntos más rápido hasta desaparecer.

Todas las tareas se guardan como episodes y queda registrado si tuvieron éxito o fracaso. Cuando hace un trabajo parecido, recupera episodes anteriores como referencia.

Proactive: se mueve antes de que se lo pidan

Hace sugerencias antes de que el usuario las pida. Si detecta señales de frustración en el flujo de trabajo —fallos repetidos, cancelaciones rápidas, acumulación de errores— propone ayuda, y si detecta un patrón de fallos repetidos genera automáticamente una regla preventiva.

Aun así, no interrumpe sin sentido. Si el usuario rechaza una sugerencia, ese feedback se rastrea. Si la rechazan 5 veces en 30 minutos, reduce automáticamente la frecuencia de intervención y sube el umbral para hacer sugerencias. El propio sistema proactivo se ajusta por sí mismo según la reacción del usuario.

Cosas que el agente puede hacer

Leer/escribir/editar/buscar archivos, ejecutar comandos de shell
Automatización del navegador — navegar por páginas, hacer clic, escribir, tomar screenshots, extraer texto
Búsqueda web (DuckDuckGo/Brave) y scraping de URLs
Análisis de código — seguimiento de símbolos basado en tree-sitter, búsqueda de definiciones/referencias, análisis de impacto de cambios
Delegación a subagentes — divide tareas complejas para ejecutarlas en paralelo
Ejecución programada basada en cron
Integración con servidores MCP — descubre y ejecuta herramientas externas automáticamente
Skills personalizadas — el usuario puede crear y registrar herramientas directamente

Seguridad

Guardian bloquea primero las acciones peligrosas, Completion/Evidence Gate verifica "si de verdad leyó, escribió y validó", y Quality Gate filtra respuestas de éxito vacías o el ocultamiento de errores. El sistema de seguridad no es fail-open, sino fail-closed.

Local-first

Toda la memoria de largo plazo tiene como source of truth archivos markdown. SQLite y FAISS son solo cachés de búsqueda, y se pueden reconstruir desde markdown en cualquier momento. Se pueden abrir directamente, modificar y versionar con git.

Interfaz

CLI + terminal UI basada en Rich
Multicanal: Telegram, Discord, Slack, LINE, WhatsApp, Google Chat, Mattermost
Web

El stack tecnológico es Python 3.13+, litellm, APSW(WAL), FAISS HNSW, tree-sitter y structlog. A través de litellm, se puede conectar cualquier LLM sin quedar atado a un proveedor de modelos específico.

RUNE-BOT: agente de IA local que aprende reglas a partir de los fracasos

Lecturas relacionadas

Aún no hay comentarios.