- Un servicio web que revisa en tiempo real el estado operativo del sitio DownDetector desde varias regiones
- Mide el código de respuesta HTTP y la latencia desde 3 servidores regionales en Londres, Auckland y Nueva York
- En todas las regiones devuelve el código HTTP 200 (respuesta correcta), y el sitio está funcionando con normalidad
- La latencia promedio por región se muestra en un rango de 478~586 ms
- Puede usarse como una herramienta de verificación de confiabilidad para plataformas clave de monitoreo de fallas
Resultados de verificación por región
- En London, UK, el estado es Up, código HTTP 200, latencia de 547 ms
- En Auckland, NZ, el estado es Up, código HTTP 200, latencia de 478 ms
- En New York, US, el estado es Up, código HTTP 200, latencia de 586 ms
- Los mismos resultados se repiten en todas las regiones, lo que confirma que el servicio de DownDetector opera normalmente
Resumen del servicio
- Este sitio es una página de monitoreo dedicada a vigilar el estado de DownDetector
- Muestra periódicamente el código de respuesta HTTP y la latencia de cada región
- Proporciona indicadores de referencia para verificar la disponibilidad de la propia plataforma de monitoreo de fallas
- No hay información adicional en el texto original
1 comentarios
Comentarios de Hacker News
Como desarrollador independiente con base en Europa, desde principios de este año cambié toda mi infraestructura a servicios europeos
Reemplacé Cloudflare por Bunny.net, AWS por Hetzner, y el correo empresarial por Infomaniak
Hasta ahora no he tenido ni una sola caída, y se siente muy bien estar completamente desvinculado de los servicios de EE. UU.
En entornos corporativos es común escuchar “esto no habría pasado si hubiéramos usado AWS”. Algo parecido a lo que antes se decía de IBM
Hetzner ofrece un conjunto de servicios mucho más simple que AWS, así que hay menos complejidad
Aun así, siguen pesando mucho factores culturales como el reconocimiento de marca o si “se ve profesional”
Cada quien es libre de elegir su infraestructura, pero la percepción sobre la disponibilidad puede diferir de la realidad
Había un aviso de mantenimiento, pero ese servidor no estaba en la lista de afectados
No digo que Hetzner sea malo; solo que en Europa también ocurren este tipo de incidentes menores
Tengo dudas de si Bunny.net puede reemplazar también esa parte
Ayer, durante la caída de Cloudflare, hasta Downdetector se cayó también, y a todos les dio risa. El timing fue perfecto
Hubo un chiste de “Tres Down Detector entraron a un bar”
El primero respondió “no sé”, el segundo también “no sé”, y el tercero dijo “sí”
Dijeron “esto sí es oro (GOLD)”, y siguió el chiste meta de “entonces, ¿quién vigila al detector de caídas que vigila al detector de caídas que vigila al detector de caídas?”
En realidad, Downdetector no estuvo completamente caído; el problema fue el módulo de verificación humana de Cloudflare
Así que técnicamente estaba “funcionando”, pero en la práctica no se podía usar
También hubo el chiste de que “necesitas otro detector de caídas para monitorear si tu detector de caídas sigue vivo”
Y salió la idea de una estructura infinita de Downdetectorsdown
Si los detectores de caídas se envían heartbeats entre sí y se monitorean mutuamente, podría existir una estructura donde el sistema completo sobrevive aunque algunos nodos mueran
Si además tuviera una arquitectura de autocuración, sería una red mucho más resiliente
También hubo un comentario tipo meme: “Sup dawg, I heard you like down detectors”
Se compartió directamente la página de estado de Downdetector
Dijeron que, con Downdetector caído por la falla de Cloudflare y eso terminando por cargar también a CloudFront, el reto era construir un nuevo CDN capaz de soportar incluso esa carga
Alguien preguntó cómo detecta Downdetector el “estado normal”
Durante la caída de Cloudflare, la página índice podría haber seguido devolviendo 200
Y si intentaras verificar con un navegador sin interfaz tomando capturas de pantalla, probablemente Cloudflare lo bloquearía
script.jshace quefetchStatus()llame agenerateMockStatus()para producir tiempos de respuesta aleatoriosO sea, no está verificando el estado real, sino mostrando datos simulados de estado