Andrew Ng: el estado actual de los agentes de IA [YouTube]

(youtube.com)

19 puntos por GN⁺ 2025-06-16 | 2 comentarios | Compartir por WhatsApp

Andrew Ng propone centrarse en el concepto de agentes de IA y sistemas agénticos (agentic) y, más que debatir la definición de agente, enfocarse en el espectro de autonomía
Hoy, las oportunidades reales de negocio son mayores en flujos de trabajo simples y lineales, o con pequeñas bifurcaciones, que en agentes completamente autónomos y complejos
Las habilidades prácticas necesarias para diseñar y operar sistemas agénticos (descomposición de tareas, sistemas de evaluación, conexión de datos, etc.) siguen siendo escasas, y la capacidad de usar distintas herramientas es importante
Evals, stack de voz (voice stack) y asistentes de código con IA son señalados como herramientas clave que no reciben suficiente atención
Los factores clave del éxito de una startup son la velocidad de ejecución y una comprensión técnica profunda; con el avance de las herramientas de IA, que más no desarrolladores adquieran habilidades básicas de programación también ayuda a mejorar la productividad

Introduction

Se presenta el contexto de cómo Andrew Ng ha contribuido a diversos proyectos y comunidades de IA/agentes, como LangChain
En vez de debatir la definición de agente, se enfatiza que los sistemas agénticos pueden tener distintos grados de autonomía
En lugar de preguntarse si es un "agente real", se propone un enfoque práctico que vea la autonomía como un espectro

Opportunities: oportunidades reales de negocio

En la práctica, muchos flujos de trabajo de negocio tienen un flujo lineal o solo incluyen algunas bifurcaciones
- Ejemplos: completar formularios web, consultar bases de datos, búsquedas simples y automatización de tareas repetitivas
Las capacidades prácticas como la descomposición de tareas y el ajuste fino (convertirlas en microtareas), el diseño de métricas de evaluación y la mejora de flujos de trabajo son escasas
Los flujos agénticos complejos también importan, pero la mayor parte de la creación de valor ocurre en estructuras repetitivas y simples

Skills: capacidades que debe tener quien construye agentes

Se requieren capacidades de diseño sistemático tras entender el proceso de negocio, como recolección/integración de datos, prompts y división de procesos
Los sistemas automatizados de evaluación (seguimiento del rendimiento por sistema/componente, construcción de frameworks de evaluación, etc.) son importantes
Los equipos con experiencia no se obsesionan con "mejoras innecesarias" y saben rodear o sustituir problemas con eficiencia
Al probar en la práctica diversas herramientas y frameworks de IA, avanzan rápido en toma de decisiones, velocidad de experimentación y combinación de herramientas (como bloques LEGO)

AI Tools & cambios

En los últimos 2~3 años, el ecosistema de herramientas de IA (por ejemplo: Langgraph, RAG, chatbots, gestión de memoria, evaluación/guardrails, etc.) se ha diversificado
Las herramientas pueden combinarse de muchas maneras como bloques LEGO, por lo que mientras más experiencia práctica se acumula, más rápido se puede decidir
Con el aumento de la ventana de contexto de los LLM, cambia el papel práctico de algunas técnicas como RAG, y disminuye la importancia del ajuste de hiperparámetros

Underrated Tools: herramientas clave subestimadas

Evals (evaluación automatizada): muchos equipos creen que es más difícil de lo que realmente es, pero es importante crear e iterar rápido, incluso empezando con ejemplos pequeños
Voice stack (flujos de trabajo basados en voz): la demanda y el uso crecen rápidamente en grandes empresas, pero la comunidad de desarrolladores aún les presta poca atención
Asistentes de código con IA: la programación asistida por IA mejora la productividad, y si todos los integrantes adquieren habilidades básicas de programación, mejora la productividad en cada rol
- Caso de AI Fund: desde recepcionistas hasta CFOs y abogados, todos aprenden a programar para aumentar la eficiencia del trabajo

Características de las aplicaciones de voz

La entrada por voz reduce la carga para el usuario y permite ingresar información más rápido que los prompts de texto
En los agentes basados en voz, el tiempo de respuesta (latencia) es muy importante (idealmente, menos de 1 segundo), y se usan varios trucos de UX para la interacción en tiempo real (por ejemplo, pre-response, ruido de fondo)
Los campos donde puede aplicarse la interfaz de voz y su potencial de uso son muy amplios, pero todavía se necesitan más herramientas para desarrolladores e infraestructura de soporte

MCP: estandarización e integración de datos

MCP (Mesh Capability Protocol): tendencia de la industria para conectar diversas fuentes de datos, APIs y herramientas mediante una interfaz estandarizada
El estándar MCP todavía está en una etapa temprana, pero se perfila como un eje clave para simplificar la integración compleja de datos y herramientas
La visión es poder integrar n agentes y m fuentes de datos con un costo de n+m, en lugar de n*m

Sistemas Agent-to-Agent

Los multiagentes y la interacción entre agentes están en una etapa muy temprana, y por ahora los casos de éxito prácticos se concentran dentro del mismo equipo
La interacción entre agentes de distintos equipos o empresas queda como un área de desarrollo futura

Vibe Coding y programación con IA

El fenómeno de "Vibe Coding" al programar junto con asistentes de IA en realidad exige mucha concentración y trabajo intelectual; a pesar del nombre, no se trata de programar "solo por sensación"
Con el avance de los asistentes de código con IA, aumenta la importancia de las habilidades de programación para más no desarrolladores y otros perfiles profesionales
Aprender a programar es clave para la productividad futura; se recomienda dominar al menos un lenguaje de programación, especialmente Python

Advice for Startups: consejos para startups de IA

La prioridad número uno para el éxito de una startup es la velocidad de ejecución, y la número dos es una comprensión profunda de la tecnología
Marketing, ventas y pricing son importantes, pero entender cómo funciona realmente la tecnología y los cambios técnicos más recientes es aún más escaso y valioso
Los equipos con intuición sobre la esencia técnica profunda pueden resolver problemas de forma más rápida y eficiente

2 comentarios

namojo 2025-06-16

¿La parte de MCP (Mesh Capability Protocol) es un error tipográfico, verdad?
Parece que la clave del éxito es cómo dividir las funciones y los permisos en el agente y cómo estructurar el flujo de trabajo.

beoks 2025-06-16

Parece que como MCP es un término que surgió hace poco, el LLM no lo aprendió y por eso usa palabras raras jaja