NambaAI - Herramienta CLI para organizar el trabajo con Codex en un flujo de SPEC, validación y handoff a PR
(github.com/Nam-Cheol)Al usar Codex, me resultaba incómodo que una solicitud ambigua terminara de inmediato en cambios de código, así que estoy creando una herramienta CLI que organiza ese proceso en un procedimiento de desarrollo más estructurado.
NambaAI no es una herramienta para reemplazar Codex, sino algo más cercano a una capa de workflow que funciona alrededor de Codex.
La idea básica es la siguiente.
request → SPEC → execution → validation → PR handoff
Es decir, en lugar de pasar la solicitud del usuario directamente a la implementación, primero ayuda a ordenar el objetivo, el alcance, las restricciones y los criterios de aceptación, dejar eso en un archivo SPEC y luego avanzar con el trabajo.
Por ahora está organizado principalmente en torno al siguiente flujo.
namba project
namba plan "solicitud de trabajo"
namba run SPEC-XXX
namba sync
namba pr
namba land
También estoy experimentando con un flujo de queue para procesar varios SPEC de forma secuencial.
La razón por la que empecé a crear esta herramienta es que, mientras más cómodo se vuelve el AI coding, más frecuente es que el proceso de cambios no quede bien trazado, o que después sea difícil verificar con qué criterios se implementó algo. En especial, al usar Codex de forma repetida, sentí que podía volverse difuso “qué se había decidido hacer”, “hasta dónde llegaba el alcance”, “cómo se hizo la validación” y “qué había que revisar en el PR”.
NambaAI es un intento de reducir ese problema de la siguiente manera.
- Organizar primero el objetivo y el alcance antes de trabajar
- Crear un archivo SPEC antes de implementar
- Registrar los resultados de ejecución y la evidencia de validación
- Generar documentación de handoff para el PR
- Ordenar los cambios hechos por Codex para que una persona pueda revisarlos con facilidad
- Gestionarlo como un proceso de desarrollo repetible, no como prompts aislados
No apunta a crear un agente autónomo de propósito general como los AI agent frameworks existentes. Por ahora, el enfoque está en usar Codex como eje central y en dividir y registrar el trabajo en unidades que el desarrollador pueda revisar.
Todavía está en una etapa temprana, así que hay muchas cosas por mejorar.
- Faltan ejemplos de uso reales
- Hace falta mejorar la documentación de onboarding
- Faltan eval packs
- Hace falta revisar la seguridad del installer/hook
- Hace falta hacer pruebas cruzadas en macOS, Linux y Windows
- Falta comparación con AI coding harness existentes
- Falta validación en proyectos reales
Es un proyecto open source inicial hecho directamente por mí y, más que un producto ya muy pulido, está en una etapa de validar la dirección que debería tomar.
Me gustaría recibir feedback, especialmente de quienes usan Codex en trabajo real o en proyectos personales, sobre los siguientes puntos.
- Si este workflow de Codex basado en SPEC parece realmente útil en el proceso de desarrollo
- Qué partes parecen sobre diseñadas
- Qué mecanismos de confianza harían falta para aplicarlo en proyectos reales
- Si existen herramientas o patrones previos con los que valga la pena compararlo
- Si hay partes del flujo de instalación o uso que parezcan incómodas o riesgosas
También acepto opiniones críticas. Como todavía está en una etapa inicial, ahora mismo me ayuda más saber con claridad cuáles son sus puntos débiles que recibir solo comentarios positivos.
1 comentarios
Lo hice con la idea de que fuera un CLI, pero últimamente lo estoy usando en Codex desktop. Me preocupaba que pudiera haber conflictos con el harness integrado de Codex desktop, pero por suerte la compatibilidad es muy fluida jaja.
Además de eso, también tengo que reflejar el contenido de esta actualización 0.131.0 de Codex, y como solo estoy usando este harness, sigo viendo partes que faltan, pero al final lo que más falta es mi propio tiempo...