1 puntos por GN⁺ 2025-04-17 | 1 comentarios | Compartir por WhatsApp
  • 12 Factor Agents presenta principios para construir aplicaciones con LLM confiables
  • Con base en la experiencia de usar frameworks de agentes de IA, se descubrió que la mayoría de los productos no son agentes reales
  • 12 Factor Agents explora cómo llevar el software basado en LLM a un nivel lo suficientemente bueno como para entregarlo a clientes
  • Los 12 factores incluyen técnicas clave para mejorar la confiabilidad, escalabilidad y mantenibilidad del software con LLM
  • Integrar conceptos modulares en productos existentes es la forma de entregar rápidamente software de IA de alta calidad

12 Factor Agents - Principios para construir aplicaciones con LLM confiables

  • Con base en la experiencia de usar frameworks de agentes de IA, se descubrió que la mayoría de los productos no son agentes reales
  • 12 Factor Agents explora cómo llevar el software basado en LLM a un nivel lo suficientemente bueno como para entregarlo a clientes
  • Los 12 factores incluyen técnicas clave para mejorar la confiabilidad, escalabilidad y mantenibilidad del software con LLM
  • Integrar conceptos modulares en productos existentes es la forma de entregar rápidamente software de IA de alta calidad

Resumen: 12 factores

  • Convertir lenguaje natural en llamadas a herramientas: comprender cómo usar lenguaje natural para invocar herramientas
  • Ser dueño del prompt: es importante poseer y gestionar el prompt
  • Ser dueño de la ventana de contexto: es importante poseer y gestionar la ventana de contexto
  • Las herramientas son salidas estructuradas: las herramientas deben considerarse como salidas estructuradas
  • Integrar el estado de ejecución y el estado de negocio: gestionar ambos de forma integrada

La promesa de los agentes

  • DAG (Directed Acyclic Graph): el software puede representarse como un grafo dirigido, y los orquestadores DAG ganaron popularidad
  • La promesa de los agentes: al usar agentes, se puede dejar atrás el DAG y permitir que el LLM decida la ruta en tiempo real
  • Los agentes funcionan en bucle: operan en un ciclo donde el LLM decide el siguiente paso, ejecuta llamadas a herramientas y agrega los resultados a la ventana de contexto

¿Por qué 12-factor agents?

  • Límites de los frameworks existentes: muchos constructores de SaaS intentan crear agentes, pero por las limitaciones de los frameworks actuales es difícil superar el 80% de calidad
  • Importancia de los conceptos modulares: integrar conceptos modulares en productos existentes es la forma de entregar rápidamente software de IA de alta calidad

Patrones de diseño para excelentes aplicaciones con LLM

  • Elementos clave de un agente: existen componentes esenciales que hacen que un agente sea excelente, y al usar un framework se pueden obtener la mayoría de ellos
  • Integración de conceptos modulares: integrar conceptos modulares en productos existentes es la forma de entregar rápidamente software de IA de alta calidad

Recursos relacionados

  • Podcast Tool Use: trata este tema en un episodio de marzo de 2025
  • The Outer Loop: blog que cubre temas relacionados
  • Webinar: webinar con @hellovai sobre cómo maximizar el rendimiento de los LLM
  • Agente de código abierto: se construyó un agente OSS usando esta metodología

1 comentarios

 
GN⁺ 2025-04-17
Opiniones de Hacker News
  • Wiki muy útil. Gracias; sin duda la voy a usar. Ayer justo lancé un "AI Agents framework". Este framework se basa en el modelo de actores, máquinas de estado y programación orientada por perspectivas. En particular, me gustan los puntos 5 y 7

    • unificar el estado de ejecución y el estado del negocio
    • ser dueño de tu propio flujo de control
    • SecAI hace esto muy bien, y como biblioteca de flujo de control por grafos, las llamadas al LLM están integradas en los nodos del grafo. La negociación, la cancelación y las relaciones de estado fortalecen el flujo y lo hacen más orgánico
    • algo que otros frameworks suelen pasar por alto son las herramientas de desarrollo dedicadas. Programas los fallos, inspeccionas cada paso en detalle y ofrece exportación automática de datos e integraciones sencillas
    • ya lancé la primera demo técnica, con una implementación de referencia que muestra todas las herramientas de desarrollo
    • el botón Send/Stop permite iniciar/pausar/reanudar con una API simple. Tiene transparencia de red, así que escala bien
  • Excelente. Después de varios años haciendo esto, hice mi propia lista de lecciones. Lo más importante es ser dueño del bucle de planificación de más bajo nivel

    • está bien tener planificación dinámica, pero debes ser dueño del bucle OODA y contar con heurísticas para decidir si está convergiendo hacia una solución
    • debes incorporar un motor de workflows y hacer que el modelo construya especificaciones de workflow que se ejecuten en ese motor
  • Qué bueno que este material haya salido justo ahora. Gracias

    • estoy imaginando un sandbox audiovisual como vvvv. La idea es insertar nodos de LM o de redes neuronales locales simples para que realicen tareas específicas, y que la salida esté muy restringida
    • el flujo de pregunta a respuesta es muy atractivo. Los pipelines de múltiples etapas también son muy interesantes
  • Me pregunto cómo encajan bibliotecas como DSPY en el factor-2

    • vi un ejemplo de usar BAML para generar prompts. No es fácil escribir a mano prompts para extraer información estructurada de datos no estructurados
    • me pregunto qué opinan de usar los prompts crudos de DSPY
  • Es un post de blog viejo, pero lo que dice sobre patrones de frameworks ha resonado conmigo durante toda mi carrera. Es mejor usar los LLM como biblioteca que como framework

    • los frameworks son más atractivos y más fáciles de vender, y llevan al lock-in y a servicios adicionales
  • Excelente. El 80% lo aprendí por las malas, y el 20% restante será una lectura valiosa

    • me ha ido bien con LangGraph y esquemas de pydantic. Tengo curiosidad por saber qué más le ha parecido útil a la gente
  • Una más: hay que planear el costo al escalar

    • escalar puede salir caro, así que primero hay que intentar resolver con componentes deterministas todo lo que se pueda. Eso puede reducir alucinaciones y latencia, y hacer una gran diferencia en costos
  • Para que sea más fácil seguir los principios, hace falta una narrativa consistente. Sería bueno usar ejemplos del mundo real

  • Muy feliz de ver esto en la portada de HN

  • Qué genial ver BAML aquí. Estoy 100% de acuerdo con tratar a los LLM como funciones