-
Planea publicar el primer miércoles de cada mes un reporte de disponibilidad que resuma los incidentes ocurridos hasta el momento, su explicación técnica y las medidas de solución
-
El objetivo es compartir todo con transparencia para que no sea solo un simple reporte de errores, sino una experiencia de la que cualquiera pueda aprender
-
La respuesta de GitHub ante los errores del sitio, que recientemente han ido en aumento
-
5/5 (interrupción de 2:24 minutos)
Ocurrió cuando el ID auto-incremental de una tabla específica de MySQL superó el valor máximo del tipo Integer
Se enviarán alertas cuando el tamaño de la PK supere el 70%, y se agregará un linter para que el framework de pruebas verifique int/bigint
- 5/22 (interrupción de 5:09 minutos)
Durante mantenimiento programado, el nuevo servidor MySQL Primary que se puso en ejecución cayó. Se desvió de urgencia el tráfico al Primary original, pero como durante los 6 segundos en que estuvo fuera de servicio recibió tráfico de escritura, tomó 4 horas restaurarlo desde una réplica y 1 hora reconfigurar el clúster.
Para minimizar el tiempo de recuperación, siguen probando la automatización del failover
- 6/19 (interrupción de 51 minutos)
Fue causado porque un cambio introducido para mejorar las pruebas A/B generó una dependencia con archivos de otra aplicación creados dinámicamente. Durante el despliegue falló la generación de ese archivo y se activó un rate limit.
Se modificará para que la configuración de pruebas A/B y multivariadas quede almacenada en caché internamente
1 comentarios
Desde que MS la adquirió, existía la sospecha de que los errores habían aumentado bastante
(tal vez les incomodó que eso llevara a pensar: “¿no será que Azure es inestable?”)
Como respuesta, anunciaron una medida frontal: publicar un informe de disponibilidad de forma transparente.
Creo que las empresas locales también deberían aprender de este tipo de respuesta.
Es un tema un poco distinto, pero si comparas los "informes de transparencia" de empresas extranjeras y locales, hay una diferencia enorme tanto en calidad como en cantidad.
Informe de transparencia (Transparency Report): compartir datos que muestran el impacto de las políticas y medidas de gobiernos y empresas sobre la protección de la privacidad, la seguridad y el uso de la información.
Informe de transparencia de Google: https://transparencyreport.google.com/?hl=ko
Informe de transparencia de Facebook: https://transparency.facebook.com/
Informe de transparencia de Naver: https://privacy.naver.com/transparency/transparency_report_statistic/…
Informe de transparencia de Kakao: https://privacy.kakao.com/transparency/statistic
No debería limitarse solo a enumerar datos,
sino que también creo que el propio informe debería estar diseñado para mostrar claramente las convicciones de la empresa.