1 puntos por GN⁺ 2024-07-30 | 1 comentarios | Compartir por WhatsApp

El impacto de CrowdStrike en la industria aeronáutica

  • El 19 de julio de 2024, CrowdStrike distribuyó una actualización de configuración de sensores a sistemas Windows
  • Debido a esta actualización, alrededor de 8.5 millones de computadoras sufrieron pantallazos azules, afectando a diversas instituciones como hospitales, bancos y sistemas 911
  • Linux, Mac y los teléfonos móviles no se vieron afectados

Impacto en la industria aeronáutica de Estados Unidos

  • Se presenta una gráfica que compara por hora la cantidad de aviones que despegaron en Estados Unidos el 19 de julio
  • En comparación con el 12 de julio, hubo una ligera disminución de 0600 a 1300, y después un ligero aumento
  • En las estadísticas acumuladas que comienzan a las 0400, hubo un aumento de 2.6% en comparación con el viernes de la semana anterior

Estadísticas por aerolínea

  • Se presentan estadísticas de las cuatro principales aerolíneas de Estados Unidos (Delta, United, American, Southwest)
  • Delta: -1087 vuelos (-46%)
  • United: -596 vuelos (-36%)
  • American: -376 vuelos (-16%)
  • Southwest: +101 vuelos (+3%)

Resumen de las aerolíneas

  • Delta fue la más golpeada, seguida por United y American
  • Southwest no se vio afectada
  • Delta tardó mucho tiempo en recuperarse, mientras que las otras aerolíneas volvieron a la normalidad más rápido

Datos y análisis

  • Se procesaron datos en bruto de ADS-B Exchange con código que detecta despegues de aeronaves
  • Los despegues se consideraron vuelos para elaborar las estadísticas

Resumen de GN⁺

  • Este es un artículo que analiza el impacto en la industria aeronáutica de la interrupción masiva de TI provocada por la actualización de CrowdStrike
  • Se presentan diversas opiniones sobre por qué Delta Air Lines tardó más en recuperarse que otras aerolíneas
  • El artículo enfatiza la importancia de la estabilidad de los sistemas de TI y de los planes de contingencia
  • Como otros proyectos con funciones similares, se recomiendan herramientas de gestión y análisis de logs como Splunk

1 comentarios

 
GN⁺ 2024-07-30
Opiniones de Hacker News
  • El software de seguimiento de tripulación de Delta recibió un golpe fuerte y tardó en recuperarse

  • Esto sugiere que muchas computadoras no deberían estar conectadas a internet

  • Parece que Delta ya se está preparando para demandar

  • Un artículo sobre cómo Southwest Airlines evitó la interrupción de CrowdStrike y Microsoft usando Windows 3.1

  • Se preguntan por qué el aeropuerto Minneapolis-St. Paul sufrió cancelaciones antes que otros aeropuertos de EE. UU.

  • Se preguntan si funcionó un plan moderno y bien ensayado de recuperación ante desastres, o si TI no pagó por respaldos y recuperación

  • Se preguntan si existe un análisis global

  • Lo interesante de esta interrupción es que los sistemas "PROD" estaban bien porque en su mayoría corrían sobre Linux y software propietario antiguo, mientras que los sistemas "CORP", que en su mayoría corrían sobre Windows, recibieron un golpe fuerte

    • Los sistemas bancarios no tuvieron problemas para mover dinero, pero los sistemas que interactúan con personas sí tuvieron problemas
  • El hecho de que Delta haya externalizado capacidades clave del negocio y haya ahorrado minimizando contratos empeoró el problema

    • Ojalá que compensar a los clientes les cueste más de lo que ahorraron
    • Fuente: Comentario de Reddit
  • Delta no tenía un plan adecuado de recuperación ante desastres ni un plan de continuidad del negocio de TI

    • UA, AA y F9 ejecutaron de inmediato planes preparados y se recuperaron rápido
    • UA y AA desplegaron planes en todas partes, desde granjas de servidores y soluciones en la nube hasta estaciones de usuario final en los aeropuertos
    • Delta externalizó gran parte de TI
    • UA y AA no dudaron en pagar horas extra al personal
    • UA y AA también dependían de Windows tanto como Delta
    • AA se recuperó para el final del viernes y reanudó operaciones normales el sábado
    • UA se recuperó unas 12 horas después y reanudó su horario normal el sábado por la tarde
    • La responsabilidad del problema recae 100% en las decisiones de TI de Delta
    • El personal de TI de menor nivel probablemente cargará con la mayor parte de la culpa y las consecuencias
  • Les gusta que "CrowdStrike" ahora se haya vuelto sinónimo de "caída global"

    • No es un nombre simpático como "heartbleed", sino el nombre de la empresa que causó el problema