El software después de la IA: comienza la era del harness
(tomtunguz.com)- El fin de la era del software marca el inicio de la era del harness, y el SaaS que operaba con flujos de trabajo fijos y bases de datos administradas está siendo reemplazado por una IA dotada de inteligencia
- La IA es poderosa, pero está sin domesticar, como un caballo salvaje; para aprovechar su fuerza se necesita una domesticación sistemática
- El harness para agentes de IA se define por 7 componentes clave alrededor de un LLM central, y cada uno determina la confiabilidad y el rendimiento a nivel de producción
- En una era en la que todas las empresas pueden acceder a los mismos modelos, no gana el modelo en sí, sino quien mejor diseña y opera el harness (best rider)
- Miles de mercados separados que los grandes laboratorios no priorizan siguen siendo una oportunidad para las startups
El significado de la era del harness
- La IA está reemplazando con inteligencia al SaaS basado en flujos de trabajo fijos y a las bases de datos administradas, redefiniendo el paradigma del software
- Se compara la IA con un mustang: poderosa pero indómita, imposible de usar tal cual, y el proceso de domesticarla es precisamente el harness
- La esencia de esa domesticación es una arquitectura que coloca al LLM en el centro y distribuye radialmente 7 componentes a su alrededor
Los 7 componentes del harness para agentes de IA
-
1. Context & Memory (contexto y memoria)
- Los modelos de propósito general requieren búsqueda personalizada según el caso de uso (bespoke retrieval); un sistema de búsqueda de contexto para un radiólogo no puede ser igual al de un asistente legal
- La memoria de corto plazo ("qué estaba haciendo el agente hace 45 segundos"), la búsqueda masiva de imágenes (radiología y generación visual) y la búsqueda por palabras clave en decenas de miles de millones de documentos requieren sistemas distintos según el caso
- Junto a la capa de búsqueda se ubica una base de datos de contexto, que funciona como un "libro de recetas" sobre cómo opera realmente el negocio
- Los procedimientos operativos estándar (SOP) que la gente lleva en la cabeza al llegar a trabajar son precisamente esa receta
- La captura inicial y su evolución conforme cambian las personas y los procesos son la esencia de la base de datos de contexto
-
2. Tools & Action (herramientas y acción)
- Las herramientas son el medio por el cual el agente influye en el mundo exterior; si las recetas de la base de datos de contexto indican qué hacer, las herramientas son los ingredientes y utensilios para hacerlo realidad
- Los harness modernos exponen herramientas mediante un registry, validan los argumentos entregados por el modelo, despachan la llamada, hacen pasar las tareas sensibles por compuertas de aprobación y procesan los resultados dentro del bucle del agente
- MCP está emergiendo como el tejido conectivo para la conexión de herramientas
- La calidad del harness se define por cuántas herramientas puede exponer de forma segura y qué tan limpiamente maneja los fallos
-
3. Orchestration & Loop (orquestación y bucle)
- El bucle del agente sigue la estructura think → act → observe → repeat
- La planificación, la descomposición de tareas, los subagentes, los reintentos y las condiciones de detención determinan cómo se ejecuta el trabajo
- Debe mejorar con el uso, y el patrón de ciclo cerrado que aprende de cada ejecución es un factor de diferenciación entre proveedores
-
4. State & Persistence (estado y persistencia)
- En grandes empresas donde muchas personas usan el sistema al mismo tiempo, la resiliencia es indispensable
- Si el harness se cae en el paso 7 de una tarea de 10 pasos, debe reanudar desde el paso 8, no empezar desde cero
- El sistema de archivos, los checkpoints, los hilos de sesión y los almacenes de artefactos son mecanismos para evitar la pérdida de trabajo
-
5. Sandbox & Compute (sandbox y cómputo)
- Cada agente necesita un espacio de trabajo aislado (sandbox)
- Un workspace Unix aislado, salida de red (egress) controlada y credenciales almacenadas fuera del modelo garantizan seguridad, confidencialidad y velocidad a gran escala
-
6. Observability & Governance (observabilidad y gobernanza)
- "Lo que no se puede ver no se puede confiar": rastrear cada paso, registrar cada llamada a herramientas, ejecutar evals como pruebas de regresión y añadir human-in-the-loop en las decisiones de mayor riesgo es lo que convierte una demo en un sistema de producción
- Los guardrails hacen cumplir políticas y los evals detectan regresiones antes que los clientes
-
7. Cost & Workflow Optimization (optimización de costos y flujos de trabajo)
- El séptimo componente es el juicio arquitectónico (architectural judgment)
- Implica decidir qué debe resolverse de forma determinista o no determinista, elegir el modelo adecuado para cada etapa (de frontera, mediano, pequeño o fine-tuned) y decidir si el conocimiento debe vivir en habilidades o en memoria
Un nuevo mapa competitivo
- El resultado es una nueva dinámica competitiva del software, que no se aplica por igual a todas las categorías
- Los mercados que priorizan los grandes laboratorios (principales centros de investigación en IA) se benefician de la rapidez de ejecución y el control directo del modelo
- Pero, aparte de esos, miles de mercados independientes siguen abiertos para las startups
- En una era en la que todas las empresas pueden usar los mismos modelos, ganan los "best riders"; es decir, la capacidad de diseñar y operar el harness se vuelve la ventaja competitiva central
Aún no hay comentarios.