Resumen clave de los 3 patrones de flujos de trabajo para agentes de IA más usados en la práctica que Anthropic organizó a partir de experiencia real en producción, y de cuándo conviene elegir cada uno.
Mensaje clave
- Cuantos más agentes hay, más importante se vuelve la estructura (el flujo de trabajo)
- Un patrón equivocado → latencia↑, costo↑, confiabilidad↓
- Los patrones no eliminan la autonomía, sino que diseñan el alcance de esa autonomía
1. Flujo de trabajo secuencial (Sequential)
- Ejecución paso a paso, en orden, una etapa a la vez (A → B → C)
- Adecuado: cuando la dependencia entre etapas es clara
Ej.: copy de marketing → traducción → revisión
extracción de datos de documentos → validación de esquema → carga en DB - Ventaja: cada agente se enfoca en una sola cosa → precisión ↑
- Desventaja: la espera alarga la latencia
- Tip: no ir siempre directo a un flujo de varios pasos; primero probar suficientemente con un solo agente
2. Flujo de trabajo paralelo (Parallel)
- Se distribuyen tareas independientes a varios agentes al mismo tiempo → luego se reúnen los resultados (fan-out → fan-in)
- Adecuado: cuando hay que evaluar varios aspectos a la vez
Ej.: revisión de código (repartiendo por tipo de vulnerabilidad)
análisis de documentos (tema, sentimiento y verificación de hechos al mismo tiempo)
evaluación de calidad desde múltiples ángulos - Ventaja: facilita separar los intereses de cada equipo y permite optimización individual
- Desventaja: muchas llamadas simultáneas a API aumentan el costo, y es indispensable diseñar la lógica para combinar resultados (¿mayoría? ¿ponderación? ¿prioridad a expertos?)
3. Flujo de trabajo evaluador-optimizador (Evaluator-Optimizer)
- El agente generador ↔ el agente evaluador intercambian retroalimentación de forma repetida
- Generación → evaluación → corrección → evaluación… (hasta cumplir el criterio de calidad o llegar al máximo de iteraciones)
- Adecuado: para trabajos donde la calidad es muy importante
Ej.: generación automática de documentación de API
comunicación con clientes (tono y cumplimiento de políticas)
redacción de consultas SQL en contextos donde la seguridad es crítica - Ventaja: especializa la generación y la evaluación → mayor nivel de acabado
- Desventaja: consume muchos tokens y tiempo → es obligatorio definir condiciones de detención (máximo de iteraciones + umbral de calidad)
Principios para aplicarlo en la práctica (¡importante!)
- Empezar por lo más simple
Si un solo agente es suficiente → listo
Si se resuelve de forma secuencial → listo
Si el primer resultado cumple el estándar → listo - Escalar solo cuando haga falta
- Los tres patrones se pueden combinar (poner paralelo dentro de secuencial, evaluadores paralelos dentro del bucle de evaluación, etc.)
Aún no hay comentarios.