- Durante las últimas décadas, el objetivo central de las herramientas de observabilidad ha sido hacer comprensibles para los humanos grandes volúmenes de datos de telemetría heterogéneos
- Con la llegada de la IA y los LLM, el paradigma tradicional centrado en "dashboards + alertas + muestreo" está cambiando, y el proceso de análisis está siendo reemplazado por automatización
- En la práctica, un agente de IA analizó la causa de un pico de latencia en 80 segundos con 8 llamadas a herramientas, automatizando una tarea que antes se hacía en demos y resolviéndola por apenas 60 centavos
- Los dashboards bonitos o la instrumentación conveniente ya no aportan un valor diferencial, porque los LLM están convirtiendo el análisis en un commodity y OpenTelemetry está haciendo lo mismo con la instrumentación
- La observabilidad del futuro tendrá como clave del éxito los bucles de retroalimentación rápidos y los flujos de trabajo colaborativos entre IA y personas, impulsando una era de más software y más automatización
Historia de las herramientas de observabilidad y llegada de la IA
- Durante décadas, el propósito central de las herramientas de observabilidad ha sido comprimir y resumir enormes volúmenes de datos heterogéneos (telemetría) hasta volverlos comprensibles para las personas
- Cada vez que aparecía una nueva abstracción de software (como Rails, AWS, Kubernetes, OpenTelemetry, etc.),
se desarrollaban diversas herramientas como monitoreo, medición, dashboards, alertas adaptativas y muestreo dinámico para ocultar esa complejidad, entregando los datos comprimidos de una forma acorde con la capacidad cognitiva humana
LLM = aproximador universal de funciones, y ahora de verdad útil
- Matemáticamente, un LLM no es más que un aproximador universal de funciones (universal function approximator), pero en la práctica resulta muy útil para resolver problemas de observabilidad
- Como ejemplo, en una demo de Honeycomb se le pidió en lenguaje natural a un agente de IA que analizara un pico de latencia en un heatmap
- “Analiza la causa de los picos de latencia que ocurren cada 4 horas en el servicio de frontend”
- Integración entre un LLM listo para usar (Claude Sonnet 4) y el Model Context Protocol (MCP) de Honeycomb
- 80 segundos, 8 llamadas a herramientas y un costo de solo 60 centavos para analizar automáticamente la causa
- Alcanzó un nivel en el que puede resolver escenarios reales en zero-shot, sin prompts adicionales, entrenamiento aparte ni guías
- Commoditización del análisis:
- Si los LLM automatizan el trabajo de análisis, las ventajas diferenciales de los productos tradicionales de observabilidad (gráficas bonitas, instrumentación sencilla, etc.) pierden relevancia
- OpenTelemetry comoditiza la instrumentación y los LLM comoditizan el análisis
- En adelante, el “bucle de retroalimentación rápido” sustituirá el valor central de las herramientas de observabilidad
El papel de las personas y los cambios del futuro
- El papel humano no desaparecerá por completo
- Así como la llegada de la nube no eliminó la existencia misma de TI, la IA tampoco sustituirá a desarrolladores ni operadores
- El aumento de productividad expande el panorama completo y hace que nazca más software
- La pregunta clave es:
en un mundo donde el costo de escribir código, refactorizar y analizar cae drásticamente, y el análisis se vuelve una constante,
hacia dónde se mueve la esencia de la observabilidad?
Lo verdaderamente importante es la “retroalimentación rápida”
- Lo más importante es contar con bucles de retroalimentación rápidos y densos en todas las etapas del desarrollo y la operación
- La IA siempre aventajará a los humanos en velocidad
- Los LLM pueden plantear decenas de hipótesis rápidamente, fallar y finalmente encontrar la respuesta correcta
(y a un costo muy bajo)
- La filosofía de Honeycomb:
- Bucles de retroalimentación rápidos, intercambio colaborativo de conocimiento y desarrollo/operación experimental
- En adelante, la asistencia de IA se incorporará a todo el ciclo de vida del desarrollo y la operación de software
- Ejemplos
- Al escribir y desplegar código, agentes de IA ofrecen retroalimentación en tiempo real y sugerencias para mejorar bugs y calidad
- Durante la operación, detectan y analizan emergent behavior, generan reportes automáticos y, tras aprobación, aplican mejoras automáticamente
- Las organizaciones más avanzadas automatizarán los roles de SRE/SWE con IA + herramientas, llegando incluso a cumplir objetivos de negocio directamente
- Condiciones futuras para una observabilidad exitosa
- Rendimiento de consultas de latencia ultrabaja
- Un almacén de datos unificado
- Flujos de trabajo fluidos de colaboración entre personas e IA
- Conclusión:
- Las herramientas tradicionales de observabilidad centradas en dashboards, alertas y visualización
ya no serán lo esencial en la era de la IA,
y solo sobrevivirán los bucles de retroalimentación rápidos y las plataformas de colaboración entre IA y personas
4 comentarios
Así como la observabilidad no fue el fin del monitoreo, los LLM probablemente tampoco sean el fin de la observabilidad.
Así como la observabilidad evolucionó sobre una base de monitoreo avanzado, el análisis con LLM también evolucionará sobre una base de observabilidad avanzada.
Tengo expectativas de que el área de Observability se va a innovar rápidamente gracias a los LLM, pero el título sí está bien clickbait jajaja
Promocionar su propio servicio diciendo que “se acerca su fin” da un poco de vergüenza ajena...
En lo personal, espero que los vision LLM sigan avanzando y se usen para tareas de monitoreo.
Hace poco vi una publicación de un padre que usaba un VLM para revisar mientras su hijo dormía si no había nada fuera de lo normal, y me pareció bastante interesante.
Opiniones de Hacker News