2 puntos por ragingwind 18 시간 전 | 2 comentarios | Compartir por WhatsApp

El ‘impuesto de la orquestación’ en la era de los agentes de IA y el cuello de botella de la atención humana

El texto de Addy Osmani aborda el problema de que ejecutar varios agentes de IA al mismo tiempo puede no traducirse directamente en una mejora real de la productividad. Los agentes pueden operar en paralelo, pero el juicio de la persona que debe entender, revisar y fusionar los resultados no se puede paralelizar; ese es el punto central. El autor llama a este costo el ‘impuesto de la orquestación’. Se refiere al costo oculto de coordinar múltiples flujos de trabajo. Visto desde la perspectiva de la delegación, también puede leerse como que lo importante no es delegar más, sino delegar solo hasta el punto que uno pueda revisar adecuadamente.

  • Argumento central

    • Explica que poner en marcha agentes de IA es fácil, pero verificar sus resultados y alinearlos con otros cambios no lo es.
    • Señala que, aunque se ejecuten varios agentes, eso no crea “más versiones de mí”; al final, el juicio y la fusión de resultados deben pasar por la atención de una sola persona.
    • Indica que sentirse ocupado y ser realmente productivo no son lo mismo.
    • Sostiene que, aunque se ejecuten 20 agentes, eso no significa automáticamente trabajo desplegado equivalente a 20 agentes.
  • Impuesto de la orquestación

    • El autor considera que el costo de coordinar varios agentes es un problema estructural. No se trata simplemente de falta de concentración o de entrenamiento, sino de un problema de diseño del sistema.
    • Los resultados generados por los agentes al final deben ser revisados por una persona. En ese proceso, temas como la precisión, la coherencia con la arquitectura y los conflictos de fusión se concentran en una sola persona.
    • Por eso, el ser humano se convierte en el componente serial lento dentro del sistema de agentes de IA. Un componente serial es la parte que no puede procesar varias cosas al mismo tiempo y debe hacerlo en secuencia.
  • Analogía técnica

    • El autor compara esta situación con el GIL de Python. El GIL es el mecanismo que hace que, aunque haya varios hilos, solo uno pueda ejecutar código Python a la vez.
    • La idea es que los agentes pueden ejecutarse simultáneamente, pero cuando llega el momento de la comprensión y el juicio reales, todos terminan esperando un único candado: la atención humana.
    • También recurre al principio de la ingeniería de rendimiento según el cual la mejora de velocidad por procesamiento paralelo está limitada por la parte que no puede paralelizarse. Aunque aumenten los agentes, si el tiempo de juicio no disminuye, es difícil que el rendimiento total crezca mucho.
  • Ventajas

    • Los agentes pueden ser útiles para procesar tareas independientes en segundo plano.
    • Tareas como escribir pruebas o generar capturas de pantalla, donde la máquina puede demostrar parcialmente el resultado, pueden reducir la carga humana.
    • Sugiere que agrupar la revisión de resultados en una sola tanda puede reducir el costo de cambio de contexto entre tareas.
  • Límites y riesgos

    • Afirma que aumentar la cantidad de agentes no incrementa el ancho de banda cognitivo humano, es decir, la capacidad de comprender y juzgar.
    • Revisar con frecuencia a los agentes puede aumentar la fatiga, porque obliga a recuperar una y otra vez contextos de trabajo distintos.
    • Advierte que, si la revisión se vuelve superficial, puede terminar aceptándose código generado por agentes sin entenderlo lo suficiente.
    • Si este costo no se gestiona bien, pueden acumularse tanto deuda técnica como deuda cognitiva. La deuda técnica es la carga de código difícil de corregir después, y la deuda cognitiva es el estado en que se siguen acumulando cambios sin que los desarrolladores entiendan realmente el sistema.
  • Diferenciador

    • El foco del texto no está en el rendimiento de los agentes de IA en sí, sino en la atención humana.
    • Señala que la productividad no debe medirse por la cantidad de agentes ejecutándose, sino por la cantidad de trabajo realmente revisado, fusionado y listo para desplegarse.
    • Un rasgo distintivo es que no ve a las personas como supervisoras externas al sistema, sino como un recurso limitado incluido dentro del propio sistema paralelo.
  • Dirección práctica

    • Propone que la escala de los agentes no se ajuste a lo que permita la interfaz de la herramienta, sino al ritmo al que uno realmente puede revisar bien.
    • Hay que dividir los tipos de trabajo. Las tareas aisladas pueden delegarse a agentes en segundo plano, pero las tareas donde el juicio es central —como bugs extraños o diseño de arquitectura— conviene no paralelizarlas.
    • Explica que la atención humana debe reservarse para juzgar, y que las partes que la máquina puede verificar deberían presentarse primero mediante pruebas o evidencia generada por los agentes.
    • La delegación, en este punto, tiene un sentido muy limitado. Más importante que la capacidad de delegar mucho es la capacidad de distinguir qué se puede delegar y qué debe juzgarse directamente.

Este texto señala que el cuello de botella en el uso de agentes de IA puede estar no en la capacidad de ejecución, sino en la capacidad de revisión y juicio. Hoy es fácil lanzar varios agentes, pero asumir responsablemente sus resultados sigue siendo una tarea humana. Por eso, la productividad no surge de aumentar la cantidad de agentes, sino de tratar la propia atención como un recurso crítico del sistema y asignar el trabajo en función de ese límite. La delegación también entra en ese mismo principio: no se trata de delegar más, sino de delegar dentro del rango que uno realmente puede juzgar bien.

2 comentarios

 
jjpark78 16 시간 전

Yo también lo he estado sintiendo últimamente: cuando dejo corriendo 10-20 tareas al mismo tiempo y vuelvo para revisarlas una por una, no logro hacer el cambio de contexto y termino pensando "¿qué era esto?", mientras trato de reconstruir el recuerdo...

 
j2sus91 13 시간 전

Si se hace como trabajo en serie, la validación y la revisión humanas inevitablemente se convierten en un cuello de botella.

Al final, el flujo de trabajo tendrá que trasladarse al procesamiento paralelo con agentes, pero la capacidad cognitiva humana tiene límites.

Parece que ha llegado una era en la que crear un bucle de validación es la clave para la calidad y la prevención de incidentes.
Y esa validación no solo debe depender de humanos; también hay que reforzar la etapa de verificación haciendo que los agentes se supervisen entre sí.