- La empresa de videojuegos Roblox sufrió una caída total de todo su sistema en octubre de 2021
- Este problema comenzó de forma pequeña por un incidente en un componente de un centro de datos
- El problema se propagó rápidamente y el sistema quedó fuera de servicio durante 73 horas
- Desde entonces, Roblox ha trabajado para aumentar la resiliencia de su infraestructura frente a los tipos de fallas que ocurren en todos los sistemas a gran escala debido a factores como aumentos extremos de tráfico, clima, fallas de hardware, errores de software y errores humanos
- Roblox se planteó: “Cuando ocurren estas fallas, ¿cómo podemos evitar que el problema de un solo componente o de un grupo de componentes se propague a todo el sistema?”
- Como resultado, dedicó esfuerzos a resolver este problema y en la primera mitad de 2023 ahorró 125 millones de horas de participación al mes en comparación con el mismo período del año anterior
Aún no hay comentarios.