31 puntos por xguru 2025-12-09 | 3 comentarios | Compartir por WhatsApp
  • Herramienta CLI para procesar tareas de desarrollo repetitivas y de varios pasos con un bucle de agentes de IA, como al implementar proyectos grandes
  • Sigue invocando Claude Code con un script de Bash para realizar pequeños cambios de código en cada iteración
    • Crea una nueva rama, modifica el código y también realiza automáticamente el commit y push
    • Crea PR mediante GitHub CLI y monitorea el estado de CI y los resultados de revisión con gh pr checks
    • Si todas las revisiones y checks especificados pasan, hace merge; si fallan, cierra el PR y descarta la rama y los cambios, repitiendo el ciclo
  • Para mantener el contexto entre iteraciones, usa un archivo Markdown compartido como SHARED_TASK_NOTES.md como memoria externa
    • En cada iteración resume lo que hizo y lo que sigue, registrándolo con una lógica de "carrera de relevos"
    • Por ejemplo, si deja una nota como “la función Y necesita manejar entradas null”, la siguiente iteración la prioriza, formando un bucle de auto-mejora
    • Los prompts están diseñados para dejar un paquete de handoff que futuros desarrolladores o agentes puedan entender de inmediato, en lugar de logs largos innecesarios
  • Ofrece un pipeline completamente automatizado que cubre todo el ciclo de vida del PR
    • Creación de rama → ejecución de Claude Code → commit → creación de PR → espera de CI y revisión → merge si pasa → actualización de la rama principal → limpieza y siguiente iteración
    • Aprovecha tal cual las reglas de code owners, checks obligatorios y entornos preview del repositorio existente, e integra naturalmente la revisión humana en el flujo
  • Con varias flags de control de ejecución, permite limitar costo, tiempo y número de intentos
    • --max-runs define el número máximo de iteraciones; con 0 ejecuta un bucle infinito
    • --max-cost establece un tope de costo en dólares y --max-duration permite fijar un límite de tiempo en formatos como 2h o 30m
    • Se pueden combinar varias para crear restricciones compuestas como “máximo 10 ejecuciones, 5 dólares y 1 hora”
  • También soporta opciones de integración con GitHub para controlar con detalle la estrategia de ramas y la estructura del repositorio
    • --merge-strategy permite elegir entre squash / merge / rebase
    • --git-branch-prefix define la convención de nombres de ramas, pudiendo cambiar continuous-claude/ por feature/, por ejemplo
    • Con las flags --owner y --repo se puede especificar explícitamente el repositorio incluso si el remoto no es GitHub o la detección automática falla
  • Se puede personalizar la forma de guardar el contexto y las condiciones de finalización
    • --notes-file permite usar otro nombre de archivo en lugar de SHARED_TASK_NOTES.md
    • --completion-signal y --completion-threshold permiten terminar antes si los agentes imprimen la frase "proyecto completado" cierta cantidad de veces o más
  • Incluye funciones de modo seguro y dry run para pruebas, depuración y experimentación
    • --disable-commits desactiva los commits, la creación de PR y el merge reales, permitiendo probar solo cambios locales
    • --dry-run simula todo el flujo y permite verificar en logs qué comandos se ejecutarían
  • Aprovecha git worktree para soportar una estructura que ejecuta varios trabajos en paralelo
    • --worktree <name> y --worktree-base-dir crean worktrees independientes para ejecutar pruebas, documentación u otras tareas en distintos directorios al mismo tiempo
    • --cleanup-worktree limpia el worktree al terminar y --list-worktrees permite ver los worktrees activos actualmente
  • Requiere como dependencias Claude Code CLI, GitHub CLI y jq, y permite preparar el entorno rápidamente con un script de instalación simple
    • Puede instalarse con un script de una sola línea en ~/.local/bin o /usr/local/bin para usar continuous-claude
  • Casos de uso reales: ideal para tareas altamente repetitivas como ampliar cobertura de pruebas, grandes refactorizaciones o corregir automáticamente código roto tras actualizar dependencias
    • Mientras Dependabot solo llega hasta la actualización de versiones, esta herramienta actúa como una versión reforzada de Dependabot al generar automáticamente incluso PR de corrección posteriores a partir de notas de versión y pruebas fallidas
    • También puede usarse en trabajos de largo plazo que generan y fusionan más de 20 PR seguidos, como dividir una base de código monolítica en varios módulos o convertir callbacks a async/await
  • Tiene un concepto similar a la investigación de Continuous AI·agentics de GitHub Next y está diseñada pensando también en ejecutar varios agentes especializados al mismo tiempo
    • Soporta patrones donde se ejecutan en paralelo agentes con distintos roles, como para pruebas, refactorización o agregado de funciones, para avanzar simultáneamente en distintas áreas de un monorepo
    • Incluso si una ejecución individual falla, permite experimentar con una estrategia iterativa que tolera desperdicio, suponiendo una caída de costos y apoyándose en una distribución de probabilidad cuya dirección general es correcta
  • En conjunto, es una herramienta que mantiene intacto el flujo de trabajo basado en PR del desarrollador humano, mientras agrega una capa de agentes de IA para encargarse del trabajo repetitivo y las tareas menores, por lo que puede conectarse de inmediato a repositorios de trabajo reales

3 comentarios

 
crawler 2025-12-09

¿El plan más caro de Claude Code era de 100 dólares?
Parece un programa hecho para exprimirlo al máximo hasta el límite.

 
cjinzy 2025-12-09

Cuesta 200 dólares.

El uso se reinicia cada semana, así que estoy pensando en probarlo antes de que se reinicie.

 
shakespeares 2025-12-09

Parece que este tipo de automatización está acelerando la idea de que ya no haga falta incluir a una persona en absoluto. Supongo que no habría problema si se trata de un proyecto que puede modificarse y desplegarse con frecuencia sin inconvenientes, pero en las pruebas intermedias seguro habrá partes que una persona tenga que revisar; me da curiosidad saber cómo resuelven eso.