El mayor cuello de botella para adoptar agentes de IA no es el rendimiento, sino la confianza (feat.

¿Qué tan autónomamente están trabajando realmente los agentes de IA?

Anthropic analizó millones de interacciones con Claude Code para medir cuánto trabajo están asumiendo realmente los agentes de IA.
El punto central del estudio no fue el rendimiento del modelo, sino cuánta autonomía les habían delegado las personas.
La mayoría de las tareas son cortas, pero el tiempo más largo de trabajo autónomo aumentó de 25 minutos a más de 45 minutos en el transcurso de 3 meses.
Lo interesante es que este cambio provino de la acumulación de confianza de los usuarios más que de las mejoras del modelo.
Los usuarios con más experiencia cambian su estrategia de supervisión hacia un “modo de monitoreo” en el que elevan la proporción de aprobaciones automáticas, pero intervienen a mitad del proceso cuando es necesario.
Además, la propia IA también muestra mecanismos de autocontrol, como hacer preguntas o detenerse cuando hay incertidumbre.
Actualmente, la mitad del uso de agentes se concentra en el desarrollo de software.
En última instancia, la autonomía de los agentes de IA está determinada más por la confianza, la cultura organizacional y la estructura de las herramientas que por el rendimiento del modelo.