Get Shit Done - sistema de desarrollo basado en metaprompts y especificaciones
(github.com/gsd-build)- Claude Code y otros usan este sistema ligero para automatizar el desarrollo basado en especificaciones (SDD), ayudando a completar proyectos sin flujos de trabajo complejos
- Mediante ingeniería de contexto, estructuración de prompts basada en XML y orquestación multiagente, evita la degradación de la calidad del código generada por la IA (context rot)
- Con comandos como
/gsd:new-project,/gsd:plan-phase,/gsd:execute-phase, automatiza todo el ciclo de desarrollo: definición de la idea → planificación → ejecución → validación - Asegura trazabilidad y eficiencia con commits atómicos de Git por cada unidad de trabajo y ejecución en paralelo (wave execution)
- Es una herramienta usada por ingenieros de Amazon, Google, Shopify y Webflow, orientada a mejorar la confiabilidad y productividad del desarrollo impulsado por IA
Resumen general
- Get Shit Done (GSD) es un sistema ligero de metaprompts y gestión de contexto que funciona en diversos entornos de desarrollo con IA como Claude Code, OpenCode, Gemini CLI, Codex, Copilot y Antigravity
- Resuelve el problema de context rot, donde la IA pierde calidad de contexto mientras escribe código, y genera resultados consistentes a partir de especificaciones
- Funciona en Mac, Windows y Linux, y puede instalarse con el comando
npx get-shit-done-cc@latest
Contexto de creación (Why I Built This)
- Fue creado para resolver el problema de las herramientas para grandes organizaciones que exigen procesos innecesariamente complejos
- GSD está diseñado bajo la idea de mantener la complejidad dentro del sistema y el flujo de trabajo simple
- Internamente realiza ingeniería de contexto, formateo de prompts en XML, orquestación de subagentes y gestión de estado
- El usuario puede completar un proyecto con comandos simples
Funciones principales y flujo de trabajo (How It Works)
-
Todo el proceso de desarrollo se compone de 6 etapas
- Inicialización del proyecto: consulta idea, restricciones, stack tecnológico, etc., y genera
PROJECT.md,ROADMAP.mdy más - Etapa de discusión: define los detalles de implementación y genera
CONTEXT.md - Etapa de planificación: investigación en paralelo y elaboración del plan, con creación de unidades de trabajo en estructura XML
- Etapa de ejecución: ejecución paralela por waves basada en dependencias, con commit y validación por tarea
- Etapa de validación: pruebas automáticas y confirmación del usuario; si falla, genera automáticamente un plan de corrección
- Iteración y cierre de hitos: repetición de cada etapa y etiquetado de release al completar hitos
- Inicialización del proyecto: consulta idea, restricciones, stack tecnológico, etc., y genera
-
Quick Mode procesa rápidamente una sola tarea, y permite control detallado con los flags
--discuss,--researchy--full
Tecnología clave (Why It Works)
- Ingeniería de contexto: gestiona el contexto completo del proyecto por archivos (
PROJECT.md,REQUIREMENTS.md,STATE.md, etc.) - Formateo de prompts en XML: define claramente cada tarea e incluye procedimientos de validación
- Orquestación multiagente: opera en paralelo con agentes especializados para investigación, planificación, ejecución y validación
- Commits atómicos de Git: asegura trazabilidad y facilidad de recuperación con commits por cada unidad de trabajo
- Diseño modular: permite agregar, insertar o modificar etapas libremente para una gestión flexible del proyecto
Sistema de comandos (Commands)
- Flujo principal:
/gsd:new-project,/gsd:plan-phase,/gsd:execute-phase,/gsd:verify-work - Soporte para diseño de UI:
/gsd:ui-phase,/gsd:ui-review - Análisis del codebase:
/gsd:map-codebase - Gestión del proyecto:
/gsd:add-phase,/gsd:insert-phase,/gsd:complete-milestone - Utilidades:
/gsd:quick,/gsd:health,/gsd:stats,/gsd:debug,/gsd:note, etc.
Ajustes y configuración (Configuration)
- El archivo de configuración
.planning/config.jsonpermite controlar modo, nivel de detalle de las etapas, perfiles de modelo, agentes de flujo, paralelización y estrategia de branching en Git - Los perfiles de modelo pueden ser
quality,balanced,budgetoinherit - La calidad y velocidad pueden ajustarse con toggles como
workflow.research,workflow.plan_checkyworkflow.verifier
Seguridad y resolución de problemas (Security & Troubleshooting)
- Archivos sensibles como
.env,secrets/,*.pem,*.key, etc., deben añadirse a la deny list de Claude Code para bloquear el acceso - Si después de la instalación hay errores de reconocimiento de comandos, se recomienda reiniciar el runtime o reinstalar
- En entornos Docker, los problemas de ruta pueden resolverse configurando
CLAUDE_CONFIG_DIR - La opción
--uninstallpermite eliminar todos los componentes
Comunidad y licencia
- Cuenta con ports comunitarios para OpenCode, Gemini CLI y Codex
- Se publica bajo licencia MIT
- “Claude Code is powerful. GSD makes it reliable.” — una herramienta para reforzar la confiabilidad de Claude Code
1 comentarios
Opiniones en Hacker News
Antes usaba Plan mode junto con Superpowers, pero al final sentí que solo con Plan mode bastaba
Estos frameworks son buenos para tareas de fire-and-forget que requieren investigación, pero sentía que consumían más de 10 veces más tokens
La diferencia en la calidad del resultado tampoco era tan grande, así que seguido me topaba con el límite de Max plan
Cuando termina el plan de implementación, sigue automáticamente sin pedirme input, pero tiene que ejecutarse dentro de un Docker sandbox
Es por una configuración de permisos riesgosa, aunque de todos modos creo que así es más seguro
Por ahora funciona bien y la productividad ha subido, pero siento que esto es una etapa intermedia del camino
Volví a probarlo después del anuncio de la versión más reciente, y como tiene varias capas de cross-check y self-review, el resultado fue más estable
Podría hacerlo manualmente, pero Superpowers automatiza ese proceso y fue mucho más cómodo
GSD produjo código considerando el contexto completo del proyecto, mientras que Plan Mode implementó justo lo necesario a nivel MVP
Según el flujo de trabajo o el tamaño de la tarea, las ventajas y desventajas son muy claras
La salida se volvió más verbosa y, al mismo tiempo, más vaga en los detalles
Solo aumentaron pasos como “design” o “figure out”, y luego pasa directo a implementar sin preguntas de seguimiento
A veces manipulaba las pruebas o producía resultados sin sentido
Al final terminé guiándolo manualmente para completar el MVP, y eso fue mucho más eficiente
Últimamente hay demasiados meta frameworks de este tipo, pero casi no he visto ninguno que realmente demuestre productividad
La mayoría solo desperdicia tokens y contamina la context window
Al final, lo que mejor me funcionó fue mantenerlo simple: dar solo la información necesaria e iterar en el orden Plan → Code → Verify
Cuando ves que Codex detecta errores que Claude por sí solo dejó pasar, sientes que no puedes confiar completamente en un solo agente
Diseño el flujo de pantallas de la app como imágenes y luego lo exporto a markdown estructurado; así el LLM entiende el contexto por pantalla
Comparado con una especificación basada en texto, esto permite detectar antes estados faltantes o flujos de error
Son útiles para quien los crea, pero a los demás pueden parecerles inútiles
Yo creo que los sistemas Spec-Driven están condenados al fracaso
Las especificaciones escritas en inglés no logran conectar el código real con el comportamiento
Este problema ya está resuelto con pruebas automatizadas
Hay que codificar el comportamiento del sistema como pruebas ejecutables
Incluso cuando el LLM genera la implementación, primero debería escribir las pruebas y validar la consistencia con mutation testing
Reuní material relacionado en este artículo y en este ejemplo de GitHub
Al final tiene que expresarse en forma de código
Consulta este enlace
La especificación cubre un campo mucho más amplio que las pruebas
Además, muchas veces el LLM ignora las pruebas o las modifica arbitrariamente
Estoy usando un sistema de IA personal y estoy pensando si hacerlo público o no
Está tan personalizado para mi trabajo que mantener una versión pública por separado sería una carga
Más que hacer que otros lo usen directamente, me gustaría compartir solo los patrones, tomando mi sistema como referencia
En la era de la IA, compartir simplemente inspiración e ideas ya tiene bastante valor
Probé GSD en un hackatón de equipo, pero tardó demasiado en entender el codebase y el consumo de tokens fue brutal
Además, hubo muchos errores al generar los transcripts del agente
Para crear unas cuantas funciones pequeñas era una herramienta excesiva
La lección fue simple: escribir buenas especificaciones + iterar en Plan mode fue mucho más eficiente
Las restricciones de diseño de Beads me parecían frustrantes, así que hice una herramienta parecida por mi cuenta
Mi versión está basada en SQLite y además le agregué sincronización bidireccional con GitHub
La clave está en conversar primero con el modelo para crear un archivo de especificación claro
Si ese archivo existe, el modelo no se olvida, y mientras más detalles tenga, mejor sale la calidad de la salida
Implementé como prototipo una idea que llevaba mucho tiempo imaginando con Claude, y salió mejor de lo esperado
El modelo sigue siendo un sistema estocástico, así que tener memoria perfecta es imposible
Presentarlo como si fuera un nuevo truco revolucionario es exagerado
Probé Superpowers y este GSD también se ve parecido, así que me daba curiosidad compararlos
Quick mode hace que pierda su propósito original, y Superpowers me pareció un punto medio razonable
Si metes este tipo de framework en el repositorio y haces que la IA mejore el propio framework, también puede servir para trabajo creativo
Aun así, este tipo de estructura parece más bien un hack temporal; cuando los modelos estén suficientemente entrenados, probablemente desaparezca de forma natural
GSD resolvió ese problema, pero como tiene demasiadas etapas, termina siendo lento
La especificación que generó Superpowers era detallada, pero le faltaban algunas funciones (por ejemplo, RSS y analítica), mientras que una especificación colaborativa que proponía migración en paralelo era más flexible
Al final hice que Claude comparara e integrara ambas especificaciones para obtener la versión final
Consulta la comparación detallada
Con Claude skills también se puede implementar suficientemente bien
He usado GSD intensivamente durante 3 meses, y está mucho más pulido que speckit, que era lo que usaba antes
Incluso tareas complejas las automatiza hasta un 95%
El 5% restante lo cierro con pruebas manuales
Con esto incluso lancé un producto SaaS (whiteboar.it)
El modelo en sí también ha mejorado, pero el aumento de productividad fue evidente
Como me dolía pagar la suscripción de FreshBooks, hice mi propia app de macOS en Swift con GSD
Implementé extracción automática de recibos y clasificación por categorías con la API de Anthropic
Empezó como webapp, pero al agregar funciones como integración con cámara terminó evolucionando a una app de escritorio completa
Gracias a GSD pude terminar mi app personal de contabilidad
Al final, la herramienta que de verdad hace falta es una que ahorre tokens
Pero todavía no existe algo así
Claude Code también gasta demasiados tokens en proyectos grandes
El nombre de “este paquete de archivos Markdown” da demasiado cringe