- YC CEO Garry Tan creó y usa esta fábrica de software open source compuesta por IA, diseñada para que una sola persona trabaje como si fuera un equipo de 20
- Está compuesta por comandos slash que cubren todo el sprint en el orden Think → Plan → Build → Review → Test → Ship → Reflect, y cada skill transfiere automáticamente el contexto a la siguiente
- Comienza con
/office-hours para validar las hipótesis del producto, luego fija la arquitectura con /plan-ceo-review · /plan-eng-review, y después automatiza desde la corrección de bugs hasta la creación de PR con /review · /qa · /ship
- Cada comando actúa como un especialista por rol: revisión de CEO, diseño del gerente de ingeniería, supervisión de diseñador, líder de QA, ingeniero de releases, etc.
- Usuarios objetivo
- Founder·CEO — fundadores técnicos que todavía quieren desplegar código por sí mismos
- Principiantes en Claude Code — usuarios que necesitan un flujo de trabajo estructurado y basado en roles en lugar de un prompt vacío
- Tech Lead·Staff Engineer — ingenieros senior que necesitan revisiones estrictas, QA y automatización de releases en cada PR
- Skills clave del sprint
/office-hours — valida hipótesis del producto con 6 preguntas obligatorias al estilo office hours de YC, genera un documento de diseño y lo pasa automáticamente a las skills posteriores
/plan-ceo-review — redefine el problema y explora un “producto de 10 estrellas”; incluye 4 modos: Expansion, Selective Expansion, Hold Scope y Reduction
/plan-eng-review — define arquitectura, flujo de datos, diagramas ASCII, edge cases, matriz de pruebas y preocupaciones de seguridad
/plan-design-review — evalúa cada dimensión del diseño con una puntuación de 0 a 10 y explica el estándar de 10 puntos; incluye detección de AI Slop y realiza 1 interacción AskUserQuestion por cada decisión de diseño
/design-consultation — construye un sistema de diseño completo desde cero y genera mockups realistas del producto
/review — detecta bugs que pasan CI pero fallan en producción, corrige automáticamente problemas obvios y marca brechas de calidad
/investigate — principio fundamental: sin investigación no hay corrección; rastrea el flujo de datos, valida hipótesis y se detiene tras 3 fallos
/design-review — tras la misma auditoría que /plan-design-review, corrige directamente los problemas encontrados y adjunta capturas antes/después
/qa — prueba la app en un navegador real, encuentra y corrige bugs, y genera automáticamente pruebas de regresión para cada corrección
/qa-only — misma metodología que /qa, pero solo genera reportes de bugs sin cambiar código
/cso — auditoría con modelo de amenazas OWASP Top 10 + STRIDE; 17 reglas para excluir falsos positivos, gate de confianza de 8/10 o más, y escenarios concretos de exploit para cada hallazgo
/ship — sincroniza con main, ejecuta pruebas, audita cobertura, hace push y crea PR; si no existe framework de pruebas, hace bootstrap automáticamente
/land-and-deploy — completa en un solo comando el merge del PR → espera de CI·deploy → validación del estado en producción
/canary — bucle de monitoreo de errores de consola, regresiones de rendimiento y caídas de páginas después del despliegue
/benchmark — mide línea base de tiempo de carga, Core Web Vitals y tamaño de recursos, y compara antes/después por PR
/document-release — actualiza toda la documentación del proyecto según lo desplegado y detecta automáticamente README obsoletos
/retro — retrospectiva semanal; análisis por persona, racha continua de despliegues, tendencia de salud de pruebas, y con /retro global integra retrospectiva completa del proyecto y de herramientas de IA (Claude Code, Codex, Gemini)
/browse — navegador Chromium real, clics reales, capturas reales, aproximadamente 100 ms por comando
/setup-browser-cookies — importa cookies de Chrome·Arc·Brave·Edge a una sesión headless para probar páginas autenticadas
/autoplan — ejecuta automáticamente en secuencia revisión de CEO → diseño → ingeniería, y solo expone al usuario las decisiones de preferencia
- Power tools
/codex — revisión de código independiente con OpenAI Codex CLI; 3 modos: review (pass/fail gate), desafío adversarial y consultoría abierta; si se ejecutan /review y /codex, hace análisis cruzado entre modelos
/careful — advierte antes de ejecutar comandos destructivos como rm -rf, DROP TABLE o force push; se activa escribiendo "be careful"
/freeze — limita la edición de archivos a directorios específicos para evitar cambios fuera de alcance durante depuración
/guard — integra /careful + /freeze, la configuración de seguridad máxima para trabajo en producción
/unfreeze — elimina los límites de /freeze
/setup-deploy — configuración de una sola vez para /land-and-deploy; detecta automáticamente plataforma, URL de producción y comando de despliegue
/gstack-upgrade — actualiza gstack a la versión más reciente y sincroniza tanto instalaciones globales como vendorizadas
- Sprints en paralelo: mediante Conductor se pueden ejecutar varias sesiones de Claude Code al mismo tiempo en workspaces aislados
- Ejemplo: una sesión con
/office-hours, otra con /review, una tercera implementando funciones y una cuarta con /qa, todo al mismo tiempo
— Fundadores, lead engineers y PM pueden hacer fork de esta fábrica de desarrollo con IA para experimentar y expandirla por su cuenta
- Además de Claude Code, funciona con cualquier agente que soporte el estándar SKILL.md, como Codex, Gemini CLI, Cursor, etc.
- Licencia MIT
4 comentarios
¡¡Guau!! Garry Tan retuiteó GeekNews.
https://x.com/garrytan/status/2035898375934300353
Como el Office Hour tardaba muchísimo, me puse a investigar y resulta que solo este skill ya tiene un markdown absurdamente largo.
Parece que cada vez está evolucionando más para que quienes tienen una empresa unipersonal puedan aprovecharlo bien.
Las office-hours están entretenidas; yo soy más de lo hands-on.