- Andrew Ng propone centrarse en el concepto de agentes de IA y sistemas agénticos (agentic) y, más que debatir la definición de agente, enfocarse en el espectro de autonomía
- Hoy, las oportunidades reales de negocio son mayores en flujos de trabajo simples y lineales, o con pequeñas bifurcaciones, que en agentes completamente autónomos y complejos
- Las habilidades prácticas necesarias para diseñar y operar sistemas agénticos (descomposición de tareas, sistemas de evaluación, conexión de datos, etc.) siguen siendo escasas, y la capacidad de usar distintas herramientas es importante
- Evals, stack de voz (voice stack) y asistentes de código con IA son señalados como herramientas clave que no reciben suficiente atención
- Los factores clave del éxito de una startup son la velocidad de ejecución y una comprensión técnica profunda; con el avance de las herramientas de IA, que más no desarrolladores adquieran habilidades básicas de programación también ayuda a mejorar la productividad
Introduction
- Se presenta el contexto de cómo Andrew Ng ha contribuido a diversos proyectos y comunidades de IA/agentes, como LangChain
- En vez de debatir la definición de agente, se enfatiza que los sistemas agénticos pueden tener distintos grados de autonomía
- En lugar de preguntarse si es un "agente real", se propone un enfoque práctico que vea la autonomía como un espectro
Opportunities: oportunidades reales de negocio
- En la práctica, muchos flujos de trabajo de negocio tienen un flujo lineal o solo incluyen algunas bifurcaciones
- Ejemplos: completar formularios web, consultar bases de datos, búsquedas simples y automatización de tareas repetitivas
- Las capacidades prácticas como la descomposición de tareas y el ajuste fino (convertirlas en microtareas), el diseño de métricas de evaluación y la mejora de flujos de trabajo son escasas
- Los flujos agénticos complejos también importan, pero la mayor parte de la creación de valor ocurre en estructuras repetitivas y simples
Skills: capacidades que debe tener quien construye agentes
- Se requieren capacidades de diseño sistemático tras entender el proceso de negocio, como recolección/integración de datos, prompts y división de procesos
- Los sistemas automatizados de evaluación (seguimiento del rendimiento por sistema/componente, construcción de frameworks de evaluación, etc.) son importantes
- Los equipos con experiencia no se obsesionan con "mejoras innecesarias" y saben rodear o sustituir problemas con eficiencia
- Al probar en la práctica diversas herramientas y frameworks de IA, avanzan rápido en toma de decisiones, velocidad de experimentación y combinación de herramientas (como bloques LEGO)
AI Tools & cambios
- En los últimos 2~3 años, el ecosistema de herramientas de IA (por ejemplo: Langgraph, RAG, chatbots, gestión de memoria, evaluación/guardrails, etc.) se ha diversificado
- Las herramientas pueden combinarse de muchas maneras como bloques LEGO, por lo que mientras más experiencia práctica se acumula, más rápido se puede decidir
- Con el aumento de la ventana de contexto de los LLM, cambia el papel práctico de algunas técnicas como RAG, y disminuye la importancia del ajuste de hiperparámetros
Underrated Tools: herramientas clave subestimadas
- Evals (evaluación automatizada): muchos equipos creen que es más difícil de lo que realmente es, pero es importante crear e iterar rápido, incluso empezando con ejemplos pequeños
- Voice stack (flujos de trabajo basados en voz): la demanda y el uso crecen rápidamente en grandes empresas, pero la comunidad de desarrolladores aún les presta poca atención
- Asistentes de código con IA: la programación asistida por IA mejora la productividad, y si todos los integrantes adquieren habilidades básicas de programación, mejora la productividad en cada rol
- Caso de AI Fund: desde recepcionistas hasta CFOs y abogados, todos aprenden a programar para aumentar la eficiencia del trabajo
Características de las aplicaciones de voz
- La entrada por voz reduce la carga para el usuario y permite ingresar información más rápido que los prompts de texto
- En los agentes basados en voz, el tiempo de respuesta (latencia) es muy importante (idealmente, menos de 1 segundo), y se usan varios trucos de UX para la interacción en tiempo real (por ejemplo, pre-response, ruido de fondo)
- Los campos donde puede aplicarse la interfaz de voz y su potencial de uso son muy amplios, pero todavía se necesitan más herramientas para desarrolladores e infraestructura de soporte
MCP: estandarización e integración de datos
- MCP (Mesh Capability Protocol): tendencia de la industria para conectar diversas fuentes de datos, APIs y herramientas mediante una interfaz estandarizada
- El estándar MCP todavía está en una etapa temprana, pero se perfila como un eje clave para simplificar la integración compleja de datos y herramientas
- La visión es poder integrar n agentes y m fuentes de datos con un costo de n+m, en lugar de n*m
Sistemas Agent-to-Agent
- Los multiagentes y la interacción entre agentes están en una etapa muy temprana, y por ahora los casos de éxito prácticos se concentran dentro del mismo equipo
- La interacción entre agentes de distintos equipos o empresas queda como un área de desarrollo futura
Vibe Coding y programación con IA
- El fenómeno de "Vibe Coding" al programar junto con asistentes de IA en realidad exige mucha concentración y trabajo intelectual; a pesar del nombre, no se trata de programar "solo por sensación"
- Con el avance de los asistentes de código con IA, aumenta la importancia de las habilidades de programación para más no desarrolladores y otros perfiles profesionales
- Aprender a programar es clave para la productividad futura; se recomienda dominar al menos un lenguaje de programación, especialmente Python
Advice for Startups: consejos para startups de IA
- La prioridad número uno para el éxito de una startup es la velocidad de ejecución, y la número dos es una comprensión profunda de la tecnología
- Marketing, ventas y pricing son importantes, pero entender cómo funciona realmente la tecnología y los cambios técnicos más recientes es aún más escaso y valioso
- Los equipos con intuición sobre la esencia técnica profunda pueden resolver problemas de forma más rápida y eficiente
2 comentarios
¿La parte de MCP (Mesh Capability Protocol) es un error tipográfico, verdad?
Parece que la clave del éxito es cómo dividir las funciones y los permisos en el agente y cómo estructurar el flujo de trabajo.
Parece que como MCP es un término que surgió hace poco, el LLM no lo aprendió y por eso usa palabras raras jaja