22 puntos por xguru 2025-04-28 | 1 comentarios | Compartir por WhatsApp
  • Guía práctica para equipos de producto e ingeniería que desarrollan por primera vez agentes basados en LLM
  • Los agentes, a diferencia de los sistemas de automatización tradicionales, son sistemas que pueden juzgar y actuar por sí mismos incluso en situaciones complejas y ambiguas
  • Explica diversos patrones de diseño, desde sistemas de un solo agente hasta orquestación multiagente
  • Enfatiza la configuración de guardrails y las estrategias de intervención humana para garantizar confiabilidad y seguridad
  • Recomienda comenzar con un alcance pequeño y expandirse gradualmente con base en la retroalimentación de los usuarios

¿Qué es un agente?

  • Un agente es un sistema que realiza tareas en nombre del usuario
  • Los modelos que solo responden una vez, como los chatbots simples o los analizadores de sentimiento, no se consideran agentes
  • Un agente tiene las siguientes dos funciones clave
    • Gestión de la ejecución del flujo de trabajo y toma de decisiones: determinar si se completó, corregir errores y devolver el control al usuario en caso de falla
    • Uso de herramientas: interactuar con sistemas externos para recopilar datos o ejecutar acciones

¿Cuándo conviene construir un agente?

  • Es adecuado para áreas donde la automatización tradicional falla o es difícil de mantener
  • Casos adecuados
    • Toma de decisiones compleja: cuando se requiere un juicio delicado, como aprobar reembolsos a clientes
    • Sistemas basados en reglas difíciles de mantener: cuando las reglas son complejas, como en la automatización de revisiones de seguridad
    • Procesamiento de datos no estructurados: cuando se necesita análisis de documentos o comprensión de lenguaje natural

Elementos básicos del diseño de agentes

  • Modelo (Model): el LLM encargado del razonamiento y las decisiones
  • Herramientas (Tools): funciones API que interactúan con sistemas externos
  • Instrucciones (Instructions): indicaciones claras que definen el comportamiento del agente

Guía para elegir el modelo

  • Desarrollar el prototipo con el modelo de mejor desempeño → después intentar cambiar a un modelo más pequeño considerando costo y latencia
  • Definir criterios de evaluación (evals) y optimizar después de validar la precisión

Cómo definir herramientas

  • Diseñar las herramientas de forma estandarizada para aumentar la reutilización
  • Tipos de herramientas
    • Consulta de datos: búsquedas en DB, lectura de documentos, búsqueda web
    • Ejecución de acciones: envío de correos electrónicos, actualización de CRM
    • Orquestación: llamar a otros agentes para repartir tareas

Mejores prácticas para redactar instrucciones

  • Aprovechar documentos operativos o de políticas existentes para redactar instrucciones claras paso a paso
  • Desglosar las tareas y especificarlas en unidades de acción concretas
  • Incluir obligatoriamente cómo manejar errores o situaciones excepcionales (casos límite)

Patrones de orquestación

Sistema de un solo agente

  • Un solo agente procesa múltiples tareas mediante un bucle repetitivo (run loop)
  • Usa plantillas de prompts para responder a diversas situaciones
  • Se recomienda mantener un solo agente mientras la complejidad siga siendo manejable

Sistema multiagente

Patrón de gerente (Manager Pattern)

  • Un agente gerente central coordina el flujo de trabajo llamando a varios agentes especializados como si fueran herramientas
  • Mantiene una interfaz consistente con el usuario

Patrón descentralizado (Decentralized Pattern)

  • Los agentes se transfieren el control entre sí mediante handoffs
  • El agente con la especialidad necesaria toma el control en el momento indicado
  • Al inicio, es adecuado para tareas simples de triage

Guardrails

Objetivo

  • Proteger la privacidad de los datos y evitar el abuso del sistema
  • Mantener la consistencia de la marca y bloquear respuestas inapropiadas

Tipos principales

  • Filtrado de relevancia: bloquear entradas no relacionadas con el tema
  • Filtrado de seguridad: detectar intentos de jailbreak
  • Filtro de información personal (PII): bloquear la exposición de información sensible
  • Moderación (Moderation): bloquear violencia y discurso de odio
  • Gestión de riesgo de herramientas: verificación adicional al invocar herramientas de alto riesgo

Estrategia de implementación

  • Dar prioridad máxima a la privacidad de los datos y a la seguridad del contenido
  • Agregar medidas continuamente según los nuevos riesgos detectados en uso real
  • Equilibrar seguridad y experiencia de usuario

Intervención humana (Human-in-the-loop)

  • Transferir el control a una persona cuando el agente falla o cuando debe manejar tareas de alto riesgo
  • Disparadores representativos
    • Superar el umbral de fallas
    • Solicitudes de tareas de alta sensibilidad (reembolsos, pagos, etc.)

Conclusión

  • Los agentes son sistemas innovadores capaces de automatizar flujos de trabajo en situaciones complejas e inciertas
  • Deben contar con un sólido esquema de modelo-herramientas-instrucciones y expandir gradualmente la orquestación
  • Es indispensable construir sistemas de guardrails e intervención humana para asegurar seguridad y confiabilidad
  • Empezar en pequeño, validar rápido y ampliar gradualmente las funciones es la clave de un despliegue exitoso

1 comentarios

 
bluekai17 2025-05-02