7 puntos por davespark 2025-11-28 | Aún no hay comentarios. | Compartir por WhatsApp

Los hábitos de la ingeniería de software tradicional (determinista, de control estricto) terminan estorbando en el desarrollo de agentes de IA (probabilísticos, centrados en la flexibilidad).

  • Según Philipp Schmid de Hugging Face, cuanto más senior es un desarrollador, más intenta “eliminar con código” la incertidumbre de los LLM, y por eso avanza más lento que un junior.
  • Analogía: hace falta pasar del rol de controlador (tradicional) al de dispatcher de agentes.
  1. El texto es el nuevo estado (State)
    • Trampa: si se fuerza la entrada en lenguaje natural a convertirse en datos estructurados (por ejemplo, true/false), se pierde contexto.
    • Solución: conservar el feedback (por ejemplo, “aprobado, enfocar en el mercado de EE. UU.”) como texto para permitir ajustes dinámicos.

  2. Cede el control
    • Trampa: si se hardcodea el flujo (por ejemplo, la ruta de cancelación de suscripción), se falla al responder a interacciones no lineales.
    • Solución: confiar en que el agente (LLM) interprete la intención según el contexto.

  3. Un error es solo otra entrada
    • Trampa: detener el programa cuando ocurre un error (enfoque tradicional) desperdicia ejecuciones costosas.
    • Solución: entregar el error como feedback para que el agente intente autorrecuperarse.

  4. De unit tests a Eval
    • Trampa: aplicar pruebas binarias (TDD) en sistemas probabilísticos no tiene sentido (hay infinitas respuestas válidas).
    • Solución: gestionar la variabilidad con confiabilidad (Pass@k), calidad (LLM Judge) y trazabilidad (Eval).

  5. Los agentes evolucionan, las API no
    • Trampa: usar API diseñadas para humanos (con contexto implícito) provoca alucinaciones en los agentes.
    • Solución: aclarar con tipado semántico detallado (por ejemplo, user_email_address) y docstrings. Los agentes pueden adaptarse a cambios en las herramientas.

Conclusión

Hay que aceptar la naturaleza probabilística y gestionarla con Eval y autocorrección. “Confía, pero verifica”: la clave no es la rigidez, sino construir sistemas resilientes. (Fuente original: “Why (Senior) Engineers Struggle to Build AI Agents” de Philipp Schmid)

Aún no hay comentarios.

Aún no hay comentarios.