¿Qué tan autónomamente están trabajando realmente los agentes de IA?
- Anthropic analizó millones de interacciones con Claude Code para medir cuánto trabajo están asumiendo realmente los agentes de IA.
- El punto central del estudio no fue el rendimiento del modelo, sino cuánta autonomía les habían delegado las personas.
- La mayoría de las tareas son cortas, pero el tiempo más largo de trabajo autónomo aumentó de 25 minutos a más de 45 minutos en el transcurso de 3 meses.
- Lo interesante es que este cambio provino de la acumulación de confianza de los usuarios más que de las mejoras del modelo.
- Los usuarios con más experiencia cambian su estrategia de supervisión hacia un “modo de monitoreo” en el que elevan la proporción de aprobaciones automáticas, pero intervienen a mitad del proceso cuando es necesario.
- Además, la propia IA también muestra mecanismos de autocontrol, como hacer preguntas o detenerse cuando hay incertidumbre.
- Actualmente, la mitad del uso de agentes se concentra en el desarrollo de software.
- En última instancia, la autonomía de los agentes de IA está determinada más por la confianza, la cultura organizacional y la estructura de las herramientas que por el rendimiento del modelo.
1 comentarios
¡Espera un momento!<ctrl+ enter>