Guía práctica de OpenAI para construir agentes [PDF de 32 páginas]

xguru · 2025-04-28T10:01:02+09:00

Guía práctica para equipos de producto e ingeniería que desarrollan por primera vez agentes basados en LLM Los agentes, a diferencia de los sistemas de automatización tradicionales, son sistemas que pueden juzgar y actuar por sí mismos incluso en situaciones complejas y ambiguas Explica diversos patrones de diseño, desde sistemas de un solo agente hasta orquestación multiagente Enfatiza la configuración de guardrails y las estrategias de intervención humana para garantizar confiabilidad y seguridad Recomienda comenzar con un alcance pequeño y expandirse gradualmente con base en la retroalimentación de los usuarios ¿Qué es un agente? Un agente es un sistema que realiza tareas en nombre del usuario Los modelos que solo responden una vez, como los chatbots simples o los analizadores de sentimiento, no se consideran agentes Un agente tiene las siguientes dos funciones clave Gestión de la ejecución del flujo de trabajo y toma de decisiones: determinar si se completó, corregir errores y devolver el control al usuario en caso de falla Uso de herramientas: interactuar con sistemas externos para recopilar datos o ejecutar acciones ¿Cuándo conviene construir un agente? Es adecuado para áreas donde la automatización tradicional falla o es difícil de mantener Casos adecuados Toma de decisiones compleja: cuando se requiere un juicio delicado, como aprobar reembolsos a clientes Sistemas basados en reglas difíciles de mantener: cuando las reglas son complejas, como en la automatización de revisiones de seguridad Procesamiento de datos no estructurados: cuando se necesita análisis de documentos o comprensión de lenguaje natural Elementos básicos del diseño de agentes Modelo (Model): el LLM encargado del razonamiento y las decisiones Herramientas (Tools): funciones API que interactúan con sistemas externos Instrucciones (Instructions): indicaciones claras que definen el comportamiento del agente Guía para elegir el modelo Desarrollar el prototipo con el modelo de mejor desempeño → después intentar cambiar a un modelo más pequeño considerando costo y latencia Definir criterios de evaluación (evals) y optimizar después de validar la precisión Cómo definir herramientas Diseñar las herramientas de forma estandarizada para aumentar la reutilización Tipos de herramientas Consulta de datos: búsquedas en DB, lectura de documentos, búsqueda web Ejecución de acciones: envío de correos electrónicos, actualización de CRM Orquestación: llamar a otros agentes para repartir tareas Mejores prácticas para redactar instrucciones Aprovechar documentos operativos o de políticas existentes para redactar instrucciones claras paso a paso Desglosar las tareas y especificarlas en unidades de acción concretas Incluir obligatoriamente cómo manejar errores o situaciones excepcionales (casos límite) Patrones de orquestación Sistema de un solo agente Un solo agente procesa múltiples tareas mediante un bucle repetitivo (run loop) Usa plantillas de prompts para responder a diversas situaciones Se recomienda mantener un solo agente mientras la complejidad siga siendo manejable Sistema multiagente Patrón de gerente (Manager Pattern) Un agente gerente central coordina el flujo de trabajo llamando a varios agentes especializados como si fueran herramientas Mantiene una interfaz consistente con el usuario Patrón descentralizado (Decentralized Pattern) Los agentes se transfieren el control entre sí mediante handoffs El agente con la especialidad necesaria toma el control en el momento indicado Al inicio, es adecuado para tareas simples de triage Guardrails Objetivo Proteger la privacidad de los datos y evitar el abuso del sistema Mantener la consistencia de la marca y bloquear respuestas inapropiadas Tipos principales Filtrado de relevancia: bloquear entradas no relacionadas con el tema Filtrado de seguridad: detectar intentos de jailbreak Filtro de información personal (PII): bloquear la exposición de información sensible Moderación (Moderation): bloquear violencia y discurso de odio Gestión de riesgo de herramientas: verificación adicional al invocar herramientas de alto riesgo Estrategia de implementación Dar prioridad máxima a la privacidad de los datos y a la seguridad del contenido Agregar medidas continuamente según los nuevos riesgos detectados en uso real Equilibrar seguridad y experiencia de usuario Intervención humana (Human-in-the-loop) Transferir el control a una persona cuando el agente falla o cuando debe manejar tareas de alto riesgo Disparadores representativos Superar el umbral de fallas Solicitudes de tareas de alta sensibilidad (reembolsos, pagos, etc.) Conclusión Los agentes son sistemas innovadores capaces de automatizar flujos de trabajo en situaciones complejas e inciertas Deben contar con un sólido esquema de modelo-herramientas-instrucciones y expandir gradualmente la orquestación Es indispensable construir sistemas de guardrails e intervención humana para asegurar seguridad y confiabilidad Empezar en pequeño, validar rápido y ampliar gradualmente las funciones es la clave de un despliegue exitoso

(cdn.openai.com)

22 puntos por xguru 2025-04-28 | 1 comentarios | Compartir por WhatsApp

Guía práctica para equipos de producto e ingeniería que desarrollan por primera vez agentes basados en LLM
Los agentes, a diferencia de los sistemas de automatización tradicionales, son sistemas que pueden juzgar y actuar por sí mismos incluso en situaciones complejas y ambiguas
Explica diversos patrones de diseño, desde sistemas de un solo agente hasta orquestación multiagente
Enfatiza la configuración de guardrails y las estrategias de intervención humana para garantizar confiabilidad y seguridad
Recomienda comenzar con un alcance pequeño y expandirse gradualmente con base en la retroalimentación de los usuarios

¿Qué es un agente?

Un agente es un sistema que realiza tareas en nombre del usuario
Los modelos que solo responden una vez, como los chatbots simples o los analizadores de sentimiento, no se consideran agentes
Un agente tiene las siguientes dos funciones clave
- Gestión de la ejecución del flujo de trabajo y toma de decisiones: determinar si se completó, corregir errores y devolver el control al usuario en caso de falla
- Uso de herramientas: interactuar con sistemas externos para recopilar datos o ejecutar acciones

¿Cuándo conviene construir un agente?

Es adecuado para áreas donde la automatización tradicional falla o es difícil de mantener
Casos adecuados
- Toma de decisiones compleja: cuando se requiere un juicio delicado, como aprobar reembolsos a clientes
- Sistemas basados en reglas difíciles de mantener: cuando las reglas son complejas, como en la automatización de revisiones de seguridad
- Procesamiento de datos no estructurados: cuando se necesita análisis de documentos o comprensión de lenguaje natural

Elementos básicos del diseño de agentes

Modelo (Model): el LLM encargado del razonamiento y las decisiones
Herramientas (Tools): funciones API que interactúan con sistemas externos
Instrucciones (Instructions): indicaciones claras que definen el comportamiento del agente

Guía para elegir el modelo

Desarrollar el prototipo con el modelo de mejor desempeño → después intentar cambiar a un modelo más pequeño considerando costo y latencia
Definir criterios de evaluación (evals) y optimizar después de validar la precisión

Cómo definir herramientas

Diseñar las herramientas de forma estandarizada para aumentar la reutilización
Tipos de herramientas
- Consulta de datos: búsquedas en DB, lectura de documentos, búsqueda web
- Ejecución de acciones: envío de correos electrónicos, actualización de CRM
- Orquestación: llamar a otros agentes para repartir tareas

Mejores prácticas para redactar instrucciones

Aprovechar documentos operativos o de políticas existentes para redactar instrucciones claras paso a paso
Desglosar las tareas y especificarlas en unidades de acción concretas
Incluir obligatoriamente cómo manejar errores o situaciones excepcionales (casos límite)

Patrones de orquestación

Sistema de un solo agente

Un solo agente procesa múltiples tareas mediante un bucle repetitivo (run loop)
Usa plantillas de prompts para responder a diversas situaciones
Se recomienda mantener un solo agente mientras la complejidad siga siendo manejable

Sistema multiagente

Patrón de gerente (Manager Pattern)

Un agente gerente central coordina el flujo de trabajo llamando a varios agentes especializados como si fueran herramientas
Mantiene una interfaz consistente con el usuario

Patrón descentralizado (Decentralized Pattern)

Los agentes se transfieren el control entre sí mediante handoffs
El agente con la especialidad necesaria toma el control en el momento indicado
Al inicio, es adecuado para tareas simples de triage

Guardrails

Objetivo

Proteger la privacidad de los datos y evitar el abuso del sistema
Mantener la consistencia de la marca y bloquear respuestas inapropiadas

Tipos principales

Filtrado de relevancia: bloquear entradas no relacionadas con el tema
Filtrado de seguridad: detectar intentos de jailbreak
Filtro de información personal (PII): bloquear la exposición de información sensible
Moderación (Moderation): bloquear violencia y discurso de odio
Gestión de riesgo de herramientas: verificación adicional al invocar herramientas de alto riesgo

Estrategia de implementación

Dar prioridad máxima a la privacidad de los datos y a la seguridad del contenido
Agregar medidas continuamente según los nuevos riesgos detectados en uso real
Equilibrar seguridad y experiencia de usuario

Intervención humana (Human-in-the-loop)

Transferir el control a una persona cuando el agente falla o cuando debe manejar tareas de alto riesgo
Disparadores representativos
- Superar el umbral de fallas
- Solicitudes de tareas de alta sensibilidad (reembolsos, pagos, etc.)

Conclusión

Los agentes son sistemas innovadores capaces de automatizar flujos de trabajo en situaciones complejas e inciertas
Deben contar con un sólido esquema de modelo-herramientas-instrucciones y expandir gradualmente la orquestación
Es indispensable construir sistemas de guardrails e intervención humana para asegurar seguridad y confiabilidad
Empezar en pequeño, validar rápido y ampliar gradualmente las funciones es la clave de un despliegue exitoso

1 comentarios

bluekai17 2025-05-02

https://notebooklm.google.com/notebook/…

Lo hice con NotebookLM.