2 puntos por GN⁺ 2024-07-29 | 1 comentarios | Compartir por WhatsApp
  • Usa LLM para clasificar las alertas entre accionables y ruido
    • Analiza el historial de alertas y las conversaciones de Slack para determinar si una alerta es accionable
    • Reduce la fatiga por alertas proporcionando información contextual para su manejo (insights y recursos adicionales)
  • Funciona integrado con Slack, analiza patrones de alertas y ofrece reportes semanales sobre las alertas del canal

Arquitectura modular

  1. Recolección de alertas: Datadog envía las alertas al servidor FastAPI mediante webhooks
  2. Servidor FastAPI: el núcleo del sistema, procesa las alertas entrantes, interactúa con Slack y gestiona el flujo de datos
  3. Integración con Slack: proporciona la interfaz de usuario para la gestión e interacción con las alertas
  4. Base de datos: usa Postgres y pgvector para almacenar datos de alertas y embeddings

Integraciones

Puede admitir múltiples integraciones usando un modelo de datos flexible. Actualmente, Opslane soporta Datadog

Resumen de GN⁺

  • Opslane es una herramienta que reduce la fatiga por alertas y hace menos estresante la experiencia de guardia al clasificar las alertas accionables
  • Mediante su integración con Slack, ayuda con la gestión de alertas y la depuración, y analiza la calidad de las alertas con reportes semanales
  • Se ofrece como software de código abierto, recibe con gusto contribuciones de la comunidad y soporta integración con Datadog
  • Herramientas con funciones similares incluyen PagerDuty y VictorOps

1 comentarios

 
GN⁺ 2024-07-29
Opiniones en Hacker News
  • Primera opinión: Se analiza un producto que reduce la fatiga de alertas al clasificar las alertas como accionables o ruido y proporcionar información de contexto para procesarlas.

    • Este problema muestra aún mejor el problema de las empresas que no logran crear una observabilidad útil.
    • El producto es bienvenido, pero ojalá no destaque como principal punto de venta el aspecto de facilitar malas prácticas culturales.
    • La industria de telecomunicaciones resolvió este problema hace 15 años mediante la automatización de Fault Management.
    • Al moverse las alertas a Slack, los datos se convirtieron en texto no estructurado, lo que hizo necesarias soluciones complejas de filtrado.
  • Segunda opinión: Expresa preocupación por usar LLM no confiables para tareas importantes.

    • Ojalá se resolviera el problema original sin agregar LLM.
  • Tercera opinión: Menciona que el fundador de All Quiet está desarrollando una herramienta que no usa LLM.

    • Los usuarios no quieren que las alertas importantes dependan de un LLM opaco.
    • La IA puede ayudar con los síntomas, pero no puede resolver la causa raíz: los problemas de observabilidad y de procesos.
  • Cuarta opinión: Expresa preocupación por filtrar la importancia de las notificaciones mediante un LLM.

  • Quinta opinión: Integrar la herramienta tan estrechamente con Slack limita las plataformas que se pueden usar.

    • También existen otras plataformas de mensajería instantánea.
    • El problema más amplio de usar IM se está discutiendo en otro hilo de comentarios.
  • Sexta opinión: Menciona que es muy fan de esta dirección.

    • Expresa curiosidad sobre el bootstrapping inicial y el establecimiento continuo de líneas base.
    • Informa que el equipo de Louie.AI está contratando para SE y puestos clave.
  • Séptima opinión: Explica por qué, en su trabajo actual, conoce los problemas del sistema de alertas pero no puede resolverlos.

    • No puede desactivar las alertas y tampoco identificar o resolver la causa raíz.
    • Operar bien el on-call es un problema cultural.
    • Las herramientas técnicas no pueden resolver problemas culturales.
    • Para resolver problemas culturales, no queda más que buscar otro trabajo o aceptar el problema.
  • Octava opinión: Felicita por haber creado el producto y señala que falta una palabra en el primer párrafo.

  • Novena opinión: Está buscando una UI similar para alertas de negocio.

    • Quiere una herramienta que use fuentes de datos como Snowflake/BigQuery.
    • Menciona que las herramientas que ha usado terminaron convirtiéndose en canales de Slack llenos de spam.