- Guía práctica para equipos de producto e ingeniería que desarrollan por primera vez agentes basados en LLM
- Los agentes, a diferencia de los sistemas de automatización tradicionales, son sistemas que pueden juzgar y actuar por sí mismos incluso en situaciones complejas y ambiguas
- Explica diversos patrones de diseño, desde sistemas de un solo agente hasta orquestación multiagente
- Enfatiza la configuración de guardrails y las estrategias de intervención humana para garantizar confiabilidad y seguridad
- Recomienda comenzar con un alcance pequeño y expandirse gradualmente con base en la retroalimentación de los usuarios
¿Qué es un agente?
- Un agente es un sistema que realiza tareas en nombre del usuario
- Los modelos que solo responden una vez, como los chatbots simples o los analizadores de sentimiento, no se consideran agentes
- Un agente tiene las siguientes dos funciones clave
- Gestión de la ejecución del flujo de trabajo y toma de decisiones: determinar si se completó, corregir errores y devolver el control al usuario en caso de falla
- Uso de herramientas: interactuar con sistemas externos para recopilar datos o ejecutar acciones
¿Cuándo conviene construir un agente?
- Es adecuado para áreas donde la automatización tradicional falla o es difícil de mantener
- Casos adecuados
- Toma de decisiones compleja: cuando se requiere un juicio delicado, como aprobar reembolsos a clientes
- Sistemas basados en reglas difíciles de mantener: cuando las reglas son complejas, como en la automatización de revisiones de seguridad
- Procesamiento de datos no estructurados: cuando se necesita análisis de documentos o comprensión de lenguaje natural
Elementos básicos del diseño de agentes
- Modelo (Model): el LLM encargado del razonamiento y las decisiones
- Herramientas (Tools): funciones API que interactúan con sistemas externos
- Instrucciones (Instructions): indicaciones claras que definen el comportamiento del agente
Guía para elegir el modelo
- Desarrollar el prototipo con el modelo de mejor desempeño → después intentar cambiar a un modelo más pequeño considerando costo y latencia
- Definir criterios de evaluación (evals) y optimizar después de validar la precisión
Cómo definir herramientas
- Diseñar las herramientas de forma estandarizada para aumentar la reutilización
- Tipos de herramientas
- Consulta de datos: búsquedas en DB, lectura de documentos, búsqueda web
- Ejecución de acciones: envío de correos electrónicos, actualización de CRM
- Orquestación: llamar a otros agentes para repartir tareas
Mejores prácticas para redactar instrucciones
- Aprovechar documentos operativos o de políticas existentes para redactar instrucciones claras paso a paso
- Desglosar las tareas y especificarlas en unidades de acción concretas
- Incluir obligatoriamente cómo manejar errores o situaciones excepcionales (casos límite)
Patrones de orquestación
Sistema de un solo agente
- Un solo agente procesa múltiples tareas mediante un bucle repetitivo (
run loop)
- Usa plantillas de prompts para responder a diversas situaciones
- Se recomienda mantener un solo agente mientras la complejidad siga siendo manejable
Sistema multiagente
Patrón de gerente (Manager Pattern)
- Un agente gerente central coordina el flujo de trabajo llamando a varios agentes especializados como si fueran herramientas
- Mantiene una interfaz consistente con el usuario
Patrón descentralizado (Decentralized Pattern)
- Los agentes se transfieren el control entre sí mediante handoffs
- El agente con la especialidad necesaria toma el control en el momento indicado
- Al inicio, es adecuado para tareas simples de triage
Guardrails
Objetivo
- Proteger la privacidad de los datos y evitar el abuso del sistema
- Mantener la consistencia de la marca y bloquear respuestas inapropiadas
Tipos principales
- Filtrado de relevancia: bloquear entradas no relacionadas con el tema
- Filtrado de seguridad: detectar intentos de
jailbreak
- Filtro de información personal (PII): bloquear la exposición de información sensible
- Moderación (Moderation): bloquear violencia y discurso de odio
- Gestión de riesgo de herramientas: verificación adicional al invocar herramientas de alto riesgo
Estrategia de implementación
- Dar prioridad máxima a la privacidad de los datos y a la seguridad del contenido
- Agregar medidas continuamente según los nuevos riesgos detectados en uso real
- Equilibrar seguridad y experiencia de usuario
Intervención humana (Human-in-the-loop)
- Transferir el control a una persona cuando el agente falla o cuando debe manejar tareas de alto riesgo
- Disparadores representativos
- Superar el umbral de fallas
- Solicitudes de tareas de alta sensibilidad (reembolsos, pagos, etc.)
Conclusión
- Los agentes son sistemas innovadores capaces de automatizar flujos de trabajo en situaciones complejas e inciertas
- Deben contar con un sólido esquema de modelo-herramientas-instrucciones y expandir gradualmente la orquestación
- Es indispensable construir sistemas de guardrails e intervención humana para asegurar seguridad y confiabilidad
- Empezar en pequeño, validar rápido y ampliar gradualmente las funciones es la clave de un despliegue exitoso
1 comentarios
https://notebooklm.google.com/notebook/…
Lo hice con NotebookLM.