19 puntos por GN⁺ 2025-06-16 | 2 comentarios | Compartir por WhatsApp
  • Andrew Ng propone centrarse en el concepto de agentes de IA y sistemas agénticos (agentic) y, más que debatir la definición de agente, enfocarse en el espectro de autonomía
  • Hoy, las oportunidades reales de negocio son mayores en flujos de trabajo simples y lineales, o con pequeñas bifurcaciones, que en agentes completamente autónomos y complejos
  • Las habilidades prácticas necesarias para diseñar y operar sistemas agénticos (descomposición de tareas, sistemas de evaluación, conexión de datos, etc.) siguen siendo escasas, y la capacidad de usar distintas herramientas es importante
  • Evals, stack de voz (voice stack) y asistentes de código con IA son señalados como herramientas clave que no reciben suficiente atención
  • Los factores clave del éxito de una startup son la velocidad de ejecución y una comprensión técnica profunda; con el avance de las herramientas de IA, que más no desarrolladores adquieran habilidades básicas de programación también ayuda a mejorar la productividad

Introduction

  • Se presenta el contexto de cómo Andrew Ng ha contribuido a diversos proyectos y comunidades de IA/agentes, como LangChain
  • En vez de debatir la definición de agente, se enfatiza que los sistemas agénticos pueden tener distintos grados de autonomía
  • En lugar de preguntarse si es un "agente real", se propone un enfoque práctico que vea la autonomía como un espectro

Opportunities: oportunidades reales de negocio

  • En la práctica, muchos flujos de trabajo de negocio tienen un flujo lineal o solo incluyen algunas bifurcaciones
    • Ejemplos: completar formularios web, consultar bases de datos, búsquedas simples y automatización de tareas repetitivas
  • Las capacidades prácticas como la descomposición de tareas y el ajuste fino (convertirlas en microtareas), el diseño de métricas de evaluación y la mejora de flujos de trabajo son escasas
  • Los flujos agénticos complejos también importan, pero la mayor parte de la creación de valor ocurre en estructuras repetitivas y simples

Skills: capacidades que debe tener quien construye agentes

  • Se requieren capacidades de diseño sistemático tras entender el proceso de negocio, como recolección/integración de datos, prompts y división de procesos
  • Los sistemas automatizados de evaluación (seguimiento del rendimiento por sistema/componente, construcción de frameworks de evaluación, etc.) son importantes
  • Los equipos con experiencia no se obsesionan con "mejoras innecesarias" y saben rodear o sustituir problemas con eficiencia
  • Al probar en la práctica diversas herramientas y frameworks de IA, avanzan rápido en toma de decisiones, velocidad de experimentación y combinación de herramientas (como bloques LEGO)

AI Tools & cambios

  • En los últimos 2~3 años, el ecosistema de herramientas de IA (por ejemplo: Langgraph, RAG, chatbots, gestión de memoria, evaluación/guardrails, etc.) se ha diversificado
  • Las herramientas pueden combinarse de muchas maneras como bloques LEGO, por lo que mientras más experiencia práctica se acumula, más rápido se puede decidir
  • Con el aumento de la ventana de contexto de los LLM, cambia el papel práctico de algunas técnicas como RAG, y disminuye la importancia del ajuste de hiperparámetros

Underrated Tools: herramientas clave subestimadas

  • Evals (evaluación automatizada): muchos equipos creen que es más difícil de lo que realmente es, pero es importante crear e iterar rápido, incluso empezando con ejemplos pequeños
  • Voice stack (flujos de trabajo basados en voz): la demanda y el uso crecen rápidamente en grandes empresas, pero la comunidad de desarrolladores aún les presta poca atención
  • Asistentes de código con IA: la programación asistida por IA mejora la productividad, y si todos los integrantes adquieren habilidades básicas de programación, mejora la productividad en cada rol
    • Caso de AI Fund: desde recepcionistas hasta CFOs y abogados, todos aprenden a programar para aumentar la eficiencia del trabajo

Características de las aplicaciones de voz

  • La entrada por voz reduce la carga para el usuario y permite ingresar información más rápido que los prompts de texto
  • En los agentes basados en voz, el tiempo de respuesta (latencia) es muy importante (idealmente, menos de 1 segundo), y se usan varios trucos de UX para la interacción en tiempo real (por ejemplo, pre-response, ruido de fondo)
  • Los campos donde puede aplicarse la interfaz de voz y su potencial de uso son muy amplios, pero todavía se necesitan más herramientas para desarrolladores e infraestructura de soporte

MCP: estandarización e integración de datos

  • MCP (Mesh Capability Protocol): tendencia de la industria para conectar diversas fuentes de datos, APIs y herramientas mediante una interfaz estandarizada
  • El estándar MCP todavía está en una etapa temprana, pero se perfila como un eje clave para simplificar la integración compleja de datos y herramientas
  • La visión es poder integrar n agentes y m fuentes de datos con un costo de n+m, en lugar de n*m

Sistemas Agent-to-Agent

  • Los multiagentes y la interacción entre agentes están en una etapa muy temprana, y por ahora los casos de éxito prácticos se concentran dentro del mismo equipo
  • La interacción entre agentes de distintos equipos o empresas queda como un área de desarrollo futura

Vibe Coding y programación con IA

  • El fenómeno de "Vibe Coding" al programar junto con asistentes de IA en realidad exige mucha concentración y trabajo intelectual; a pesar del nombre, no se trata de programar "solo por sensación"
  • Con el avance de los asistentes de código con IA, aumenta la importancia de las habilidades de programación para más no desarrolladores y otros perfiles profesionales
  • Aprender a programar es clave para la productividad futura; se recomienda dominar al menos un lenguaje de programación, especialmente Python

Advice for Startups: consejos para startups de IA

  • La prioridad número uno para el éxito de una startup es la velocidad de ejecución, y la número dos es una comprensión profunda de la tecnología
  • Marketing, ventas y pricing son importantes, pero entender cómo funciona realmente la tecnología y los cambios técnicos más recientes es aún más escaso y valioso
  • Los equipos con intuición sobre la esencia técnica profunda pueden resolver problemas de forma más rápida y eficiente

2 comentarios

 
namojo 2025-06-16

¿La parte de MCP (Mesh Capability Protocol) es un error tipográfico, verdad?
Parece que la clave del éxito es cómo dividir las funciones y los permisos en el agente y cómo estructurar el flujo de trabajo.

 
beoks 2025-06-16

Parece que como MCP es un término que surgió hace poco, el LLM no lo aprendió y por eso usa palabras raras jaja