4 puntos por GN⁺ 2 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp
  • El fin de la era del software marca el inicio de la era del harness, y el SaaS que operaba con flujos de trabajo fijos y bases de datos administradas está siendo reemplazado por una IA dotada de inteligencia
  • La IA es poderosa, pero está sin domesticar, como un caballo salvaje; para aprovechar su fuerza se necesita una domesticación sistemática
  • El harness para agentes de IA se define por 7 componentes clave alrededor de un LLM central, y cada uno determina la confiabilidad y el rendimiento a nivel de producción
  • En una era en la que todas las empresas pueden acceder a los mismos modelos, no gana el modelo en sí, sino quien mejor diseña y opera el harness (best rider)
  • Miles de mercados separados que los grandes laboratorios no priorizan siguen siendo una oportunidad para las startups

El significado de la era del harness

  • La IA está reemplazando con inteligencia al SaaS basado en flujos de trabajo fijos y a las bases de datos administradas, redefiniendo el paradigma del software
  • Se compara la IA con un mustang: poderosa pero indómita, imposible de usar tal cual, y el proceso de domesticarla es precisamente el harness
  • La esencia de esa domesticación es una arquitectura que coloca al LLM en el centro y distribuye radialmente 7 componentes a su alrededor

Los 7 componentes del harness para agentes de IA

  • 1. Context & Memory (contexto y memoria)

    • Los modelos de propósito general requieren búsqueda personalizada según el caso de uso (bespoke retrieval); un sistema de búsqueda de contexto para un radiólogo no puede ser igual al de un asistente legal
    • La memoria de corto plazo ("qué estaba haciendo el agente hace 45 segundos"), la búsqueda masiva de imágenes (radiología y generación visual) y la búsqueda por palabras clave en decenas de miles de millones de documentos requieren sistemas distintos según el caso
    • Junto a la capa de búsqueda se ubica una base de datos de contexto, que funciona como un "libro de recetas" sobre cómo opera realmente el negocio
      • Los procedimientos operativos estándar (SOP) que la gente lleva en la cabeza al llegar a trabajar son precisamente esa receta
      • La captura inicial y su evolución conforme cambian las personas y los procesos son la esencia de la base de datos de contexto
  • 2. Tools & Action (herramientas y acción)

    • Las herramientas son el medio por el cual el agente influye en el mundo exterior; si las recetas de la base de datos de contexto indican qué hacer, las herramientas son los ingredientes y utensilios para hacerlo realidad
    • Los harness modernos exponen herramientas mediante un registry, validan los argumentos entregados por el modelo, despachan la llamada, hacen pasar las tareas sensibles por compuertas de aprobación y procesan los resultados dentro del bucle del agente
    • MCP está emergiendo como el tejido conectivo para la conexión de herramientas
    • La calidad del harness se define por cuántas herramientas puede exponer de forma segura y qué tan limpiamente maneja los fallos
  • 3. Orchestration & Loop (orquestación y bucle)

    • El bucle del agente sigue la estructura think → act → observe → repeat
    • La planificación, la descomposición de tareas, los subagentes, los reintentos y las condiciones de detención determinan cómo se ejecuta el trabajo
    • Debe mejorar con el uso, y el patrón de ciclo cerrado que aprende de cada ejecución es un factor de diferenciación entre proveedores
  • 4. State & Persistence (estado y persistencia)

    • En grandes empresas donde muchas personas usan el sistema al mismo tiempo, la resiliencia es indispensable
    • Si el harness se cae en el paso 7 de una tarea de 10 pasos, debe reanudar desde el paso 8, no empezar desde cero
    • El sistema de archivos, los checkpoints, los hilos de sesión y los almacenes de artefactos son mecanismos para evitar la pérdida de trabajo
  • 5. Sandbox & Compute (sandbox y cómputo)

    • Cada agente necesita un espacio de trabajo aislado (sandbox)
    • Un workspace Unix aislado, salida de red (egress) controlada y credenciales almacenadas fuera del modelo garantizan seguridad, confidencialidad y velocidad a gran escala
  • 6. Observability & Governance (observabilidad y gobernanza)

    • "Lo que no se puede ver no se puede confiar": rastrear cada paso, registrar cada llamada a herramientas, ejecutar evals como pruebas de regresión y añadir human-in-the-loop en las decisiones de mayor riesgo es lo que convierte una demo en un sistema de producción
    • Los guardrails hacen cumplir políticas y los evals detectan regresiones antes que los clientes
  • 7. Cost & Workflow Optimization (optimización de costos y flujos de trabajo)

    • El séptimo componente es el juicio arquitectónico (architectural judgment)
    • Implica decidir qué debe resolverse de forma determinista o no determinista, elegir el modelo adecuado para cada etapa (de frontera, mediano, pequeño o fine-tuned) y decidir si el conocimiento debe vivir en habilidades o en memoria

Un nuevo mapa competitivo

  • El resultado es una nueva dinámica competitiva del software, que no se aplica por igual a todas las categorías
  • Los mercados que priorizan los grandes laboratorios (principales centros de investigación en IA) se benefician de la rapidez de ejecución y el control directo del modelo
  • Pero, aparte de esos, miles de mercados independientes siguen abiertos para las startups
  • En una era en la que todas las empresas pueden usar los mismos modelos, ganan los "best riders"; es decir, la capacidad de diseñar y operar el harness se vuelve la ventaja competitiva central

Aún no hay comentarios.

Aún no hay comentarios.