El fin de semana del creador del vibe coding
- Karpathy le dejó un proyecto de fin de semana a un agente. Le dio solo la IP, el nombre de usuario, la contraseña y el objetivo, y 30 minutos después todo estaba terminado
- Una forma de trabajar en la que no se escribe código directamente el 99% del tiempo, sino que se dan instrucciones y se supervisa al agente — “ingeniería agéntica”
- Pero aunque el 60% de los desarrolladores usa IA, la delegación total apenas llega al 0-20% — la paradoja de la delegación. “Do you trust your agents?” La mayoría todavía responde “no”
① Capacidad de descomposición (Decomposition)
- Si dices “hazme una función de registro”, algo sale. El problema es que hay una alta probabilidad de que no sea lo que yo quería
- La experiencia de dejarle al agente la pantalla AddPlan lanzándole solo el PRD terminó en decenas de rondas de ping-pong y medio día perdido
- Entrevista de 5 minutos con IA mediante diálogo socrático → organización previa de edge cases → reducido a 2-3 rondas de corrección
- Darse tiempo para pensar antes de implementar, esos 5 minutos ahorran 4 horas
② Diseño de contexto (Context Architecture)
- Es importante escribir bien AGENTS.md, pero si la propia arquitectura del código está bien diseñada, la velocidad con la que el agente entiende el contexto cambia por completo
- El agente se perdía en un directorio plano, pero al reorganizarlo en directorios por feature hubo una mejora inmediata
- Armin Ronacher: “Las herramientas deben estar preparadas para que un mono caótico de LLM las use completamente mal”
③ Definición de terminado (Definition of Done)
- Dejé corriendo un proyecto CLI toda la noche y terminó en una hora — solo configuró las definiciones de tipos y la lógica de negocio quedó como un cascarón vacío
- En el segundo intento, el agente reescribió las pruebas a su conveniencia
- El “terminado” del agente es distinto de mi “terminado”
- El sistema DoD de 7 etapas de Elvis (PR→CI→3 code reviews→Telegram) es extremo, pero muestra la dirección
④ Recuperación ante fallos (Failure Recovery Loop)
- En el motor de redistribución, el mismo parámetro tenía semánticas distintas según la función → arreglas A y se rompe B en un ciclo infinito
- Reintentar con el mismo prompt es como seguir golpeándote la cabeza contra la pared en la misma dirección
- Si clasificas los fallos en 3 tipos (falta de contexto, error de dirección, conflicto estructural), la solución se vuelve clara
- La barrera de “Must NOT Have” rompió el ciclo infinito
⑤ Observabilidad (Observability)
- Dejarle liquidglass al agente y pensar “se ve raro... mejor lo dejamos así” fue la decisión más cara
- 20 archivos quedaron enredados y ya no era posible hacer rollback
- Después vino la estrategia de tracer bullets + blueprint — con una tecnología que aplicas por primera vez no puedes dibujar el blueprint de antemano, así que los tracer bullets te lo trazan rápido
- La observabilidad construye confianza, y la confianza hace posible la delegación
⑥ Diseño de memoria (Memory Architecture)
- Si trabajas 3 días seguidos, cada mañana pierdes 15 minutos explicando el contexto
- Con Claude Code hooks, se extrae memoria automáticamente al terminar la sesión → restauración en 5 segundos en la siguiente sesión
- El equipo de Boris Cherny hace check-in de CLAUDE.md en git para compartirlo entre todos
- Una estructura en la que no se transmite la memoria individual, sino la memoria del equipo, al agente
⑦ Gestión en paralelo (Parallel Orchestration)
- Boris Cherny ejecuta entre 10 y 15 sesiones en paralelo al mismo tiempo
- La experiencia de gestionar 6 squads en la época de CTO se parece sorprendentemente a la gestión paralela de agentes
- No es ADHD, es multitarea intencional = gestión
- Las personas hacen preguntas, pero los agentes no preguntan y avanzan según su propio juicio — el diseño previo es todavía más importante
⑧ Diseño de capas de abstracción (Abstraction Layering)
- Level 0 (programación directa) → Level 1 (instrucciones al agente) → Level 2 (orquestador) → Level 3 (metadiseño)
- La experiencia de convertir una rutina diaria de 20 minutos en una habilidad y reducirla a 2 minutos
- Ingeniería compuesta — un proyecto no es un juego de línea de meta, sino un juego de interés compuesto. Las sesiones anteriores impactan a las posteriores de forma acumulativa
⑨ Criterio (Taste)
- El diseño hecho por IA saca 60-70 puntos. En el momento en que entra el diseño de Ellie, aparece esa sensación de “ah, esto sí funciona”
- Un post de organización de información hecho por IA obtuvo 0 likes, mientras que una sola línea escrita por impulso presumiendo algo alcanzó 30 mil vistas
- “No Skill, No Taste” de KinglyCrow — los LLM bajaron la barrera de entrada de la skill, pero la verdadera barrera, el taste, más bien se amplificó
- Chris Lattner: “Cuanto más se automatiza la implementación, más aumenta la importancia del diseño, el juicio y el criterio”
- En una era en la que el 80% se desborda, la diferenciación sale del 20% restante
Para cerrar
- Lo que se terminó fue el tecleo, no la ingeniería
- Estas 9 cosas ya eran cualidades de un buen ingeniero incluso antes de la IA
- Aumentó el apalancamiento del buen diseño, pero también el daño del mal diseño
- El protagonista de ese show no es la IA, sino el ingeniero que sabe manejar bien la IA
3 comentarios
Con solo mantener bien el SSoT, se puede reducir bastante la alucinación. Y además se ahorran tokens.
"Lo que terminó fue teclear, no la ingeniería"
Coincido. Jaja
Gracias. Me asustó que saliera cowork, que hasta hace de servidor con solo dejar la PC encendida, pero esto me deja un poco más tranquilo y ya me ayuda a imaginar cómo podría cambiar todo en el futuro jaja.