Geas - harness de gobernanza basado en contratos para trabajo prolongado con múltiples agentes en Cl

▎ Problemas cuando varios agentes de IA escriben código al mismo tiempo: no se sabe quién tomó qué decisiones, no se puede verificar si el resultado cumple los requisitos, y lo aprendido desaparece en la siguiente sesión.

▎ - Asigna a cada tarea un TaskContract con criterios de aceptación verificables
▎ - Evidence Gate de 3 etapas: ejecución de código → comparación con el contrato → verificación de alineación con la misión
▎ - Las decisiones de arquitectura se toman mediante votación estructurada con objeción obligatoria (Critic)
▎ - Retro después de cada tarea → aprendizaje entre sesiones con rules.md + memoria por agente
▎ - Registro completo de auditoría de decisiones en el directorio .geas/

▎ Filosofía central: "Don't trust. Verify." — no se confía en que el agente diga "ya quedó", sino que se valida con evidencia frente al contrato.

La parte de arriba fue escrita por Claude. Al principio, este proyecto comenzó porque quería ver a múltiples agentes con distintas perspectivas comunicándose y trabajando como una startup, pero mientras avanzaba me pareció que también podría ser efectivo en desarrollo real, así que lo estudié desde la perspectiva de la ingeniería de harnesses y desarrollé el proyecto en esa dirección.

Planeo seguir usándolo y mejorándolo continuamente tanto en el trabajo como en proyectos personales, así que si lo prueban y me comparten su feedback, se los agradeceré mucho.

Geas - harness de gobernanza basado en contratos para trabajo prolongado con múltiples agentes en Claude Code

Aún no hay comentarios.

Geas - harness de gobernanza basado en contratos para trabajo prolongado con múltiples agentes en Claude Code

Lecturas relacionadas

Aún no hay comentarios.