- La ingeniería de software representa alrededor del 50% de todas las llamadas a herramientas de agentes de IA, mientras que 16 verticales como salud, legal y finanzas no llegan ni al 5% cada una
- La capacidad real de los modelos de IA ya alcanza para realizar tareas que a una persona le tomarían 5 horas, pero en el uso real las sesiones en el percentil 99.9 duran apenas 42 minutos, lo que revela una gran brecha entre capacidad y confianza
- A medida que se acumula experiencia de uso, la tasa de aprobación automática sube del 20% a más del 40%, y al mismo tiempo los usuarios avanzados cambian su estrategia de supervisión de aprobación previa a monitoreo activo
- La clave de la IA vertical está en la integración de datos propietarios, la ingeniería de contexto especializada por dominio y la gestión del cambio del cliente, y eso es lo que distingue a un simple wrapper de una empresa defendible
- Así como SaaS produjo más de 170 unicornios en las últimas décadas, es posible que aparezca un unicornio de IA vertical por cada unicornio SaaS, y la versión con IA puede reemplazar no solo software sino también operadores
La ingeniería de software ocupa la mitad de la actividad de los agentes de IA
- Según un estudio de Anthropic sobre el uso real de agentes de IA, la ingeniería de software representa el 49.7% de las llamadas de herramientas agénticas
- Salud apenas llega al 1%, legal al 0.9% y educación al 1.8%, y ninguna de las 16 verticales supera el 9%
- Esto no significa que el mercado esté saturado, sino que todavía no termina de formarse
- Han Wang lo describe como una oportunidad greenfield que la mayoría de los fundadores pasa por alto
- El autor de este texto, Garry Tan, menciona que “si estuviera emprendiendo ahora, pondría atención en la zona roja de este gráfico”
Brecha de despliegue (Deployment Overhang)
- Según la evaluación de METR, los modelos Claude pueden realizar tareas que a un humano le tomarían 5 horas, pero las sesiones reales duran en promedio apenas 42 minutos
- La brecha entre lo que la IA puede hacer y lo que los usuarios están dispuestos a permitir crea una oportunidad enorme
- Entre octubre de 2025 y enero de 2026, la duración de turnos en el percentil 99.9 casi se duplicó, de menos de 25 minutos a más de 45 minutos
- Esto refleja no solo una mejora en el rendimiento del modelo, sino también que los usuarios acumularon confianza con cada sesión
- En datos internos, la tasa de éxito de Claude Code se duplicó, y la intervención humana por sesión bajó de 5.4 a 3.3 veces
- La capacidad del modelo ya es suficiente, pero el despliegue no avanza al mismo ritmo; ahí hay una nueva oportunidad de producto
Cómo evoluciona la confianza
- Los usuarios nuevos solo aprueban automáticamente el 20% de las sesiones de Claude Code, pero después de 750 sesiones de experiencia, más del 40% cambia a aprobación totalmente automática
- Contra lo que podría parecer, los usuarios avanzados no intervienen menos sino más: tasa de intervención del 5% en novatos frente al 9% en expertos
- No es una contradicción, sino un cambio en la estrategia de supervisión (oversight): los principiantes aprueban previamente cada paso, mientras que los expertos delegan e intervienen si surge un problema (aprobación previa → monitoreo activo)
- Hallazgo relacionado con seguridad: en tareas complejas, Claude Code plantea preguntas de verificación más del doble de seguido que la frecuencia con que los humanos intervienen
- Es un patrón donde el agente no sigue adelante a ciegas, sino que se detiene por sí mismo cuando hay incertidumbre
- La lección central de Anthropic: la autonomía que un agente ejerce en la práctica es co-construida por el modelo, el usuario y el producto
El playbook de Aaron Levie para IA vertical
- La fórmula que propone Aaron Levie para construir IA vertical:
- Entender los datos, flujos de trabajo y barreras regulatorias propios de cada industria es la base de una empresa altamente defendible
- No basta con un simple wrapper; se necesitan capacidades de integración de datos propios, automatización de workflows y gestión del cambio
- Construir software agéntico conectado a datos propietarios
- Diseñar el software para que funcione de acuerdo con los problemas y las personas reales
- Maximizar la inteligencia de salida con ingeniería de contexto especializada por dominio
- Lo que la mayoría de los fundadores pasa por alto: impulsar la gestión del cambio (change management) para el cliente
- La IA vertical es defendible porque cualquiera puede crear un wrapper, pero son pocos los que pueden navegar workflows concretos, restricciones regulatorias y fricción organizacional en áreas como facturación en salud, discovery legal o permisos de construcción
- SaaS creció 10 veces cada década durante varias décadas, y en los últimos 20 años más del 40% del capital de venture capital se concentró en SaaS, creando más de 170 unicornios SaaS
- La tesis central: por cada unicornio SaaS puede existir un unicornio de IA vertical, y la versión con IA puede ser 10 veces más grande porque reemplaza no solo software sino también operadores
Insight de co-construcción (Co-Construction) e implicaciones de política
- Hallazgos centrales de Anthropic:
- La autonomía no es una propiedad intrínseca del modelo, sino algo co-construido por el modelo, el usuario y el producto
- Las evaluaciones previas al despliegue no alcanzan para captarlo, por lo que es indispensable medir en entornos reales
- Métricas de seguridad: hubo intervención humana en el 73% de las llamadas a herramientas, y solo el 0.8% fue clasificado como acciones irreversibles
- Los despliegues más riesgosos (filtración de API keys, trading autónomo de criptomonedas, etc.) en su mayoría son evaluaciones de seguridad, no producción real
- La política de “aprobar todas las acciones” solo perjudica la productividad sin mejorar la seguridad;
un mejor objetivo de política es garantizar que los humanos puedan monitorear e intervenir
Dónde se esconden los unicornios
- La ingeniería de software ya está bastante tomada, mientras que salud, legal, finanzas, educación, atención al cliente y logística, entre otras,
siguen siendo 16 verticales con participación de mercado de un solo dígito esperando a alguien que incorpore expertise de dominio en agentes
- Antes nacieron 300 unicornios SaaS; después vendrán 300 unicornios de IA vertical
- Los fundadores que elijan una vertical, integren expertise de dominio en agentes y resuelvan la gestión del cambio dominarán el software empresarial de la próxima década
- Los modelos ya pueden trabajar durante 5 horas, pero los usuarios solo permiten 42 minutos
- Esto muestra que seguimos en una etapa temprana del uso de IA, y
- sugiere que todavía hay muchos sectores donde ni un solo minuto de inteligencia ha sido aplicado
Aún no hay comentarios.