81 puntos por flowkater 2026-03-01 | 3 comentarios | Compartir por WhatsApp

El fin de semana del creador del vibe coding

  • Karpathy le dejó un proyecto de fin de semana a un agente. Le dio solo la IP, el nombre de usuario, la contraseña y el objetivo, y 30 minutos después todo estaba terminado
  • Una forma de trabajar en la que no se escribe código directamente el 99% del tiempo, sino que se dan instrucciones y se supervisa al agente — “ingeniería agéntica”
  • Pero aunque el 60% de los desarrolladores usa IA, la delegación total apenas llega al 0-20% — la paradoja de la delegación. “Do you trust your agents?” La mayoría todavía responde “no”

① Capacidad de descomposición (Decomposition)

  • Si dices “hazme una función de registro”, algo sale. El problema es que hay una alta probabilidad de que no sea lo que yo quería
  • La experiencia de dejarle al agente la pantalla AddPlan lanzándole solo el PRD terminó en decenas de rondas de ping-pong y medio día perdido
  • Entrevista de 5 minutos con IA mediante diálogo socrático → organización previa de edge cases → reducido a 2-3 rondas de corrección
  • Darse tiempo para pensar antes de implementar, esos 5 minutos ahorran 4 horas

② Diseño de contexto (Context Architecture)

  • Es importante escribir bien AGENTS.md, pero si la propia arquitectura del código está bien diseñada, la velocidad con la que el agente entiende el contexto cambia por completo
  • El agente se perdía en un directorio plano, pero al reorganizarlo en directorios por feature hubo una mejora inmediata
  • Armin Ronacher: “Las herramientas deben estar preparadas para que un mono caótico de LLM las use completamente mal”

③ Definición de terminado (Definition of Done)

  • Dejé corriendo un proyecto CLI toda la noche y terminó en una hora — solo configuró las definiciones de tipos y la lógica de negocio quedó como un cascarón vacío
  • En el segundo intento, el agente reescribió las pruebas a su conveniencia
  • El “terminado” del agente es distinto de mi “terminado”
  • El sistema DoD de 7 etapas de Elvis (PR→CI→3 code reviews→Telegram) es extremo, pero muestra la dirección

④ Recuperación ante fallos (Failure Recovery Loop)

  • En el motor de redistribución, el mismo parámetro tenía semánticas distintas según la función → arreglas A y se rompe B en un ciclo infinito
  • Reintentar con el mismo prompt es como seguir golpeándote la cabeza contra la pared en la misma dirección
  • Si clasificas los fallos en 3 tipos (falta de contexto, error de dirección, conflicto estructural), la solución se vuelve clara
  • La barrera de “Must NOT Have” rompió el ciclo infinito

⑤ Observabilidad (Observability)

  • Dejarle liquidglass al agente y pensar “se ve raro... mejor lo dejamos así” fue la decisión más cara
  • 20 archivos quedaron enredados y ya no era posible hacer rollback
  • Después vino la estrategia de tracer bullets + blueprint — con una tecnología que aplicas por primera vez no puedes dibujar el blueprint de antemano, así que los tracer bullets te lo trazan rápido
  • La observabilidad construye confianza, y la confianza hace posible la delegación

⑥ Diseño de memoria (Memory Architecture)

  • Si trabajas 3 días seguidos, cada mañana pierdes 15 minutos explicando el contexto
  • Con Claude Code hooks, se extrae memoria automáticamente al terminar la sesión → restauración en 5 segundos en la siguiente sesión
  • El equipo de Boris Cherny hace check-in de CLAUDE.md en git para compartirlo entre todos
  • Una estructura en la que no se transmite la memoria individual, sino la memoria del equipo, al agente

⑦ Gestión en paralelo (Parallel Orchestration)

  • Boris Cherny ejecuta entre 10 y 15 sesiones en paralelo al mismo tiempo
  • La experiencia de gestionar 6 squads en la época de CTO se parece sorprendentemente a la gestión paralela de agentes
  • No es ADHD, es multitarea intencional = gestión
  • Las personas hacen preguntas, pero los agentes no preguntan y avanzan según su propio juicio — el diseño previo es todavía más importante

⑧ Diseño de capas de abstracción (Abstraction Layering)

  • Level 0 (programación directa) → Level 1 (instrucciones al agente) → Level 2 (orquestador) → Level 3 (metadiseño)
  • La experiencia de convertir una rutina diaria de 20 minutos en una habilidad y reducirla a 2 minutos
  • Ingeniería compuesta — un proyecto no es un juego de línea de meta, sino un juego de interés compuesto. Las sesiones anteriores impactan a las posteriores de forma acumulativa

⑨ Criterio (Taste)

  • El diseño hecho por IA saca 60-70 puntos. En el momento en que entra el diseño de Ellie, aparece esa sensación de “ah, esto sí funciona”
  • Un post de organización de información hecho por IA obtuvo 0 likes, mientras que una sola línea escrita por impulso presumiendo algo alcanzó 30 mil vistas
  • “No Skill, No Taste” de KinglyCrow — los LLM bajaron la barrera de entrada de la skill, pero la verdadera barrera, el taste, más bien se amplificó
  • Chris Lattner: “Cuanto más se automatiza la implementación, más aumenta la importancia del diseño, el juicio y el criterio”
  • En una era en la que el 80% se desborda, la diferenciación sale del 20% restante

Para cerrar

  • Lo que se terminó fue el tecleo, no la ingeniería
  • Estas 9 cosas ya eran cualidades de un buen ingeniero incluso antes de la IA
  • Aumentó el apalancamiento del buen diseño, pero también el daño del mal diseño
  • El protagonista de ese show no es la IA, sino el ingeniero que sabe manejar bien la IA

3 comentarios

 
armila 2026-03-03

Con solo mantener bien el SSoT, se puede reducir bastante la alucinación. Y además se ahorran tokens.

 
tsboard 2026-03-03

"Lo que terminó fue teclear, no la ingeniería"

Coincido. Jaja

 
yangeok 2026-03-02

Gracias. Me asustó que saliera cowork, que hasta hace de servidor con solo dejar la PC encendida, pero esto me deja un poco más tranquilo y ya me ayuda a imaginar cómo podría cambiar todo en el futuro jaja.