18 puntos por GN⁺ 2026-02-23 | Aún no hay comentarios. | Compartir por WhatsApp
  • La ingeniería de software representa alrededor del 50% de todas las llamadas a herramientas de agentes de IA, mientras que 16 verticales como salud, legal y finanzas no llegan ni al 5% cada una
  • La capacidad real de los modelos de IA ya alcanza para realizar tareas que a una persona le tomarían 5 horas, pero en el uso real las sesiones en el percentil 99.9 duran apenas 42 minutos, lo que revela una gran brecha entre capacidad y confianza
  • A medida que se acumula experiencia de uso, la tasa de aprobación automática sube del 20% a más del 40%, y al mismo tiempo los usuarios avanzados cambian su estrategia de supervisión de aprobación previa a monitoreo activo
  • La clave de la IA vertical está en la integración de datos propietarios, la ingeniería de contexto especializada por dominio y la gestión del cambio del cliente, y eso es lo que distingue a un simple wrapper de una empresa defendible
  • Así como SaaS produjo más de 170 unicornios en las últimas décadas, es posible que aparezca un unicornio de IA vertical por cada unicornio SaaS, y la versión con IA puede reemplazar no solo software sino también operadores

La ingeniería de software ocupa la mitad de la actividad de los agentes de IA

  • Según un estudio de Anthropic sobre el uso real de agentes de IA, la ingeniería de software representa el 49.7% de las llamadas de herramientas agénticas
  • Salud apenas llega al 1%, legal al 0.9% y educación al 1.8%, y ninguna de las 16 verticales supera el 9%
  • Esto no significa que el mercado esté saturado, sino que todavía no termina de formarse
  • Han Wang lo describe como una oportunidad greenfield que la mayoría de los fundadores pasa por alto
  • El autor de este texto, Garry Tan, menciona que “si estuviera emprendiendo ahora, pondría atención en la zona roja de este gráfico

Brecha de despliegue (Deployment Overhang)

  • Según la evaluación de METR, los modelos Claude pueden realizar tareas que a un humano le tomarían 5 horas, pero las sesiones reales duran en promedio apenas 42 minutos
  • La brecha entre lo que la IA puede hacer y lo que los usuarios están dispuestos a permitir crea una oportunidad enorme
  • Entre octubre de 2025 y enero de 2026, la duración de turnos en el percentil 99.9 casi se duplicó, de menos de 25 minutos a más de 45 minutos
    • Esto refleja no solo una mejora en el rendimiento del modelo, sino también que los usuarios acumularon confianza con cada sesión
  • En datos internos, la tasa de éxito de Claude Code se duplicó, y la intervención humana por sesión bajó de 5.4 a 3.3 veces
  • La capacidad del modelo ya es suficiente, pero el despliegue no avanza al mismo ritmo; ahí hay una nueva oportunidad de producto

Cómo evoluciona la confianza

  • Los usuarios nuevos solo aprueban automáticamente el 20% de las sesiones de Claude Code, pero después de 750 sesiones de experiencia, más del 40% cambia a aprobación totalmente automática
  • Contra lo que podría parecer, los usuarios avanzados no intervienen menos sino más: tasa de intervención del 5% en novatos frente al 9% en expertos
    • No es una contradicción, sino un cambio en la estrategia de supervisión (oversight): los principiantes aprueban previamente cada paso, mientras que los expertos delegan e intervienen si surge un problema (aprobación previa → monitoreo activo)
  • Hallazgo relacionado con seguridad: en tareas complejas, Claude Code plantea preguntas de verificación más del doble de seguido que la frecuencia con que los humanos intervienen
    • Es un patrón donde el agente no sigue adelante a ciegas, sino que se detiene por sí mismo cuando hay incertidumbre
  • La lección central de Anthropic: la autonomía que un agente ejerce en la práctica es co-construida por el modelo, el usuario y el producto

El playbook de Aaron Levie para IA vertical

  • La fórmula que propone Aaron Levie para construir IA vertical:
    • Entender los datos, flujos de trabajo y barreras regulatorias propios de cada industria es la base de una empresa altamente defendible
    • No basta con un simple wrapper; se necesitan capacidades de integración de datos propios, automatización de workflows y gestión del cambio
    • Construir software agéntico conectado a datos propietarios
    • Diseñar el software para que funcione de acuerdo con los problemas y las personas reales
    • Maximizar la inteligencia de salida con ingeniería de contexto especializada por dominio
    • Lo que la mayoría de los fundadores pasa por alto: impulsar la gestión del cambio (change management) para el cliente
  • La IA vertical es defendible porque cualquiera puede crear un wrapper, pero son pocos los que pueden navegar workflows concretos, restricciones regulatorias y fricción organizacional en áreas como facturación en salud, discovery legal o permisos de construcción
  • SaaS creció 10 veces cada década durante varias décadas, y en los últimos 20 años más del 40% del capital de venture capital se concentró en SaaS, creando más de 170 unicornios SaaS
  • La tesis central: por cada unicornio SaaS puede existir un unicornio de IA vertical, y la versión con IA puede ser 10 veces más grande porque reemplaza no solo software sino también operadores

Insight de co-construcción (Co-Construction) e implicaciones de política

  • Hallazgos centrales de Anthropic:
    • La autonomía no es una propiedad intrínseca del modelo, sino algo co-construido por el modelo, el usuario y el producto
    • Las evaluaciones previas al despliegue no alcanzan para captarlo, por lo que es indispensable medir en entornos reales
  • Métricas de seguridad: hubo intervención humana en el 73% de las llamadas a herramientas, y solo el 0.8% fue clasificado como acciones irreversibles
    • Los despliegues más riesgosos (filtración de API keys, trading autónomo de criptomonedas, etc.) en su mayoría son evaluaciones de seguridad, no producción real
  • La política de “aprobar todas las acciones” solo perjudica la productividad sin mejorar la seguridad;
    un mejor objetivo de política es garantizar que los humanos puedan monitorear e intervenir

Dónde se esconden los unicornios

  • La ingeniería de software ya está bastante tomada, mientras que salud, legal, finanzas, educación, atención al cliente y logística, entre otras,
    siguen siendo 16 verticales con participación de mercado de un solo dígito esperando a alguien que incorpore expertise de dominio en agentes
  • Antes nacieron 300 unicornios SaaS; después vendrán 300 unicornios de IA vertical
  • Los fundadores que elijan una vertical, integren expertise de dominio en agentes y resuelvan la gestión del cambio dominarán el software empresarial de la próxima década
  • Los modelos ya pueden trabajar durante 5 horas, pero los usuarios solo permiten 42 minutos
    • Esto muestra que seguimos en una etapa temprana del uso de IA, y
    • sugiere que todavía hay muchos sectores donde ni un solo minuto de inteligencia ha sido aplicado

Aún no hay comentarios.

Aún no hay comentarios.