gstack - El equipo virtual de ingeniería creado con Claude Code
(github.com/garrytan)- YC CEO Garry Tan creó y usa esta fábrica de software open source compuesta por IA, diseñada para que una sola persona trabaje como si fuera un equipo de 20
- Está compuesta por comandos slash que cubren todo el sprint en el orden Think → Plan → Build → Review → Test → Ship → Reflect, y cada skill transfiere automáticamente el contexto a la siguiente
- Comienza con
/office-hourspara validar las hipótesis del producto, luego fija la arquitectura con/plan-ceo-review·/plan-eng-review, y después automatiza desde la corrección de bugs hasta la creación de PR con/review·/qa·/ship - Cada comando actúa como un especialista por rol: revisión de CEO, diseño del gerente de ingeniería, supervisión de diseñador, líder de QA, ingeniero de releases, etc.
- Usuarios objetivo
- Founder·CEO — fundadores técnicos que todavía quieren desplegar código por sí mismos
- Principiantes en Claude Code — usuarios que necesitan un flujo de trabajo estructurado y basado en roles en lugar de un prompt vacío
- Tech Lead·Staff Engineer — ingenieros senior que necesitan revisiones estrictas, QA y automatización de releases en cada PR
- Skills clave del sprint
/office-hours— valida hipótesis del producto con 6 preguntas obligatorias al estilo office hours de YC, genera un documento de diseño y lo pasa automáticamente a las skills posteriores/plan-ceo-review— redefine el problema y explora un “producto de 10 estrellas”; incluye 4 modos: Expansion, Selective Expansion, Hold Scope y Reduction/plan-eng-review— define arquitectura, flujo de datos, diagramas ASCII, edge cases, matriz de pruebas y preocupaciones de seguridad/plan-design-review— evalúa cada dimensión del diseño con una puntuación de 0 a 10 y explica el estándar de 10 puntos; incluye detección de AI Slop y realiza 1 interacción AskUserQuestion por cada decisión de diseño/design-consultation— construye un sistema de diseño completo desde cero y genera mockups realistas del producto/review— detecta bugs que pasan CI pero fallan en producción, corrige automáticamente problemas obvios y marca brechas de calidad/investigate— principio fundamental: sin investigación no hay corrección; rastrea el flujo de datos, valida hipótesis y se detiene tras 3 fallos/design-review— tras la misma auditoría que/plan-design-review, corrige directamente los problemas encontrados y adjunta capturas antes/después/qa— prueba la app en un navegador real, encuentra y corrige bugs, y genera automáticamente pruebas de regresión para cada corrección/qa-only— misma metodología que/qa, pero solo genera reportes de bugs sin cambiar código/cso— auditoría con modelo de amenazas OWASP Top 10 + STRIDE; 17 reglas para excluir falsos positivos, gate de confianza de 8/10 o más, y escenarios concretos de exploit para cada hallazgo/ship— sincroniza conmain, ejecuta pruebas, audita cobertura, hace push y crea PR; si no existe framework de pruebas, hace bootstrap automáticamente/land-and-deploy— completa en un solo comando el merge del PR → espera de CI·deploy → validación del estado en producción/canary— bucle de monitoreo de errores de consola, regresiones de rendimiento y caídas de páginas después del despliegue/benchmark— mide línea base de tiempo de carga, Core Web Vitals y tamaño de recursos, y compara antes/después por PR/document-release— actualiza toda la documentación del proyecto según lo desplegado y detecta automáticamente README obsoletos/retro— retrospectiva semanal; análisis por persona, racha continua de despliegues, tendencia de salud de pruebas, y con/retro globalintegra retrospectiva completa del proyecto y de herramientas de IA (Claude Code, Codex, Gemini)/browse— navegador Chromium real, clics reales, capturas reales, aproximadamente 100 ms por comando/setup-browser-cookies— importa cookies de Chrome·Arc·Brave·Edge a una sesión headless para probar páginas autenticadas/autoplan— ejecuta automáticamente en secuencia revisión de CEO → diseño → ingeniería, y solo expone al usuario las decisiones de preferencia
- Power tools
/codex— revisión de código independiente con OpenAI Codex CLI; 3 modos: review (pass/fail gate), desafío adversarial y consultoría abierta; si se ejecutan/reviewy/codex, hace análisis cruzado entre modelos/careful— advierte antes de ejecutar comandos destructivos comorm -rf,DROP TABLEo force push; se activa escribiendo "be careful"/freeze— limita la edición de archivos a directorios específicos para evitar cambios fuera de alcance durante depuración/guard— integra/careful+/freeze, la configuración de seguridad máxima para trabajo en producción/unfreeze— elimina los límites de/freeze/setup-deploy— configuración de una sola vez para/land-and-deploy; detecta automáticamente plataforma, URL de producción y comando de despliegue/gstack-upgrade— actualiza gstack a la versión más reciente y sincroniza tanto instalaciones globales como vendorizadas
- Sprints en paralelo: mediante Conductor se pueden ejecutar varias sesiones de Claude Code al mismo tiempo en workspaces aislados
- Ejemplo: una sesión con
/office-hours, otra con/review, una tercera implementando funciones y una cuarta con/qa, todo al mismo tiempo
— Fundadores, lead engineers y PM pueden hacer fork de esta fábrica de desarrollo con IA para experimentar y expandirla por su cuenta
- Ejemplo: una sesión con
- Además de Claude Code, funciona con cualquier agente que soporte el estándar SKILL.md, como Codex, Gemini CLI, Cursor, etc.
- Licencia MIT
4 comentarios
¡¡Guau!! Garry Tan retuiteó GeekNews.
https://x.com/garrytan/status/2035898375934300353
Como el Office Hour tardaba muchísimo, me puse a investigar y resulta que solo este skill ya tiene un markdown absurdamente largo.
Parece que cada vez está evolucionando más para que quienes tienen una empresa unipersonal puedan aprovecharlo bien.
Las office-hours están entretenidas; yo soy más de lo hands-on.