- Entre 2022 y 2026, el paradigma de desarrollo de IA cambió tres veces: Prompt Engineering → Context Engineering → Harness Engineering
- Cada transición surgió del fracaso del paradigma anterior para cumplir lo que prometía, y el rigor de la ingeniería no desapareció, sino que simplemente se trasladó del prompt al contexto, y del contexto al harness
- [Era 1] Prompt Engineering (2022~2024)
- “El inglés es el nuevo lenguaje de programación”, “piensa paso a paso”
- Por más sofisticado que sea un prompt, no conoce archivos que no estén dentro de la ventana de contexto
- [Era 2] Context Engineering (2025)
- De “¿qué hay que decir?” a “¿qué información hay que meter?”
- Incluso si se arma un contexto perfecto, si el loop que lo consume está mal diseñado, igual falla
- [Era 2.5] Vibe coding y su resaca
- Aceptar todas las sugerencias de IA sin siquiera revisar el diff: el código creció más allá de un nivel legible
- “Aunque el LLM haya escrito el código, si tú lo revisaste, eso no es vibe coding”
- [Era 3] Harness Engineering (2026~)
- “Si el agente se equivoca, no arregles al agente, arregla el harness”
- Agente = modelo + harness
- Arquitectura de 3 agentes de Anthropic, patrón Ralph, Lethal Trifecta, Rule of Two de Meta AI
- En 2026, la métrica clave ya no es la calidad del prompt, sino el KV-cache hit rate (la tasa a la que el modelo reutiliza cálculos previos) y la complejidad del harness
- La resaca del vibe coding, la incapacidad de los agentes para autoevaluarse, las vulnerabilidades de seguridad y otras barreras reales de producción demostraron los límites de cada era, y el harness es una respuesta estructural a todos esos problemas
- Cada era no reemplaza a la anterior, sino que la subsume; el prompt engineering no murió, sino que pasó a ser un submódulo del harness engineering
- El harness debe poder desmontarse (rippable): cuando el modelo mejora, la mitad de la lógica existente de recuperación de errores deja de ser necesaria
- Siguiente dirección del rigor: Guardian Agent (capa de supervisión en tiempo real) → ingeniería de evaluación (behavior beats benchmarks) → motor de conocimiento (combinación de grafo de código, historial de commits y memoria)
8 comentarios
No se puede seguir todo uno por uno,
así que
"si es tan bueno, supongo que la guía oficial lo actualizará"
y confío en eso.
De hecho, hasta ahora ha sido así.
Aunque GitHub no sea el dominador del mercado, sí pensaba que estaba a la vanguardia de la tendencia. El alcance de cada proyecto es demasiado pequeño, así que su adopción en el mercado es baja, pero en conjunto creo que estaban creando muchos conceptos efectivos. Quizá sea porque soy desarrollador.
¿Qué vendrá en la próxima era?
Ni idea de cuál sería la tercera era que sigue.
Ahora también habría que agregar un meta harness ahí.
bueno
Parece que Youngmin Kim, data scientist de AWS Korea, organizó muy bien el registro de varios años de cambios en la forma de desarrollar.
Creo que es un buen texto para mostrarles a desarrolladores que se preguntan: ¿qué es exactamente lo que ha cambiado tanto últimamente?
El artículo es realmente bueno.