- ¿Por qué la reserva de vuelos se convirtió en el "Hello World" de las demos de agentes de IA?
- Los usuarios prefieren una UX ya terminada (por ejemplo, Google Flights) antes que una IA que les reserve un vuelo
- Un solo error puede desatar un complejo infierno de servicio al cliente
- Un sistema intuitivo y predecible puede ser, de hecho, más innovador
- La IA todavía está en una etapa temprana, y los usuarios comunes esperan consistencia y previsibilidad
- Ejemplo: incluso con 80% de precisión, si entrega resultados consistentes, puede ser aceptable
En cambio, una precisión irregular del 90% destruye la confianza
- Muchos proyectos de IA pasan esto por alto y persiguen demos llamativas y funciones forzadas → al final pierden la confianza
- Cada vez más IDE están perdiendo transparencia
- El usuario no puede saber qué está haciendo la IA
- Ejemplo: el caso viral en Reddit de Cursor borrando todo el trabajo
- También hubo un problema de falta de experiencia del usuario con el control de versiones, pero la causa real fue el diseño de UI/UX
- Un buen diseño debe prevenir errores, explicar claramente el comportamiento de la IA y ofrecer una función de deshacer
- En sus inicios, Cursor:
- Ofrecía una interacción transparente y ligera con una interfaz de autocompletado con Tab
- Ganó popularidad construyendo la confianza del usuario gradualmente
- Un diseño simple y reversible fue eficaz para reducir la desconfianza hacia la IA
- Devin, que recibió una inversión de $200 millones, apunta a ser un "agente totalmente autónomo"
- Sistemas complejos, respuestas lentas y resultados impredecibles provocaron un colapso de la confianza
- Un enfoque demasiado ambicioso terminó generando más confusión para el usuario
Rapidez vs. confiabilidad: el dilema de los equipos de desarrollo de IA
- Los equipos de desarrollo de IA deben elegir entre lo siguiente:
- Moverse rápido y aceptar errores
- Priorizar la confiabilidad y la estabilidad
- La respuesta es enfocarse en funciones que puedan ofrecer resultados sobresalientes en un alcance pequeño y mejorarlas de forma iterativa y constante
Principio clave: previsibilidad por encima de la complejidad
- Hay que enfocarse en tareas bien entendidas, en lugar de sistemas complejos
- Los agentes de IA siguen siendo transformadores, pero estas tres cosas deben estar al centro:
- Confiabilidad
- Transparencia
- Previsibilidad
Workflow vs. agente
- El enfoque de Anthropic: "Si una tarea puede expresarse como un workflow, construye un workflow y no un agente"
- Un workflow es predecible, controlable y simple
- Como los agentes son complejos y difíciles de controlar, solo deberían usarse en situaciones realmente dinámicas
1 comentarios
Opinión en Hacker News
El agente de "reservar vuelos" ya se volvió material de chiste. Incluso se mencionó en la keynote de un evento reciente de AI engineering de Swyx
Investigadores de Google DeepMind están trabajando en investigación para aumentar la confiabilidad de los agentes
Reservar vuelos es una tarea que no se le puede dejar a la IA
En muchos casos la gente tiende a intentar encajar la IA en workflows existentes
A partir de mi experiencia usando Cursor, llegué a la conclusión de que la confiabilidad es importante
Creo que en los avances tecnológicos de los últimos 20 años la confiabilidad ha sido más importante
Un comentario en un hilo de Reddit sobre el estado actual de la programación con IA resume cómo me siento
Tengo el principio de que, cuando la IA escribe código, al menos debo poder entender ese código
Creo que el workflow es más importante que los agentes
Google Flights ya ofrece una UX perfecta