2 puntos por GN⁺ 2025-06-13 | 1 comentarios | Compartir por WhatsApp
  • Se produjo una interrupción del servicio en Google Cloud Platform
  • Persisten errores en el servicio Vertex AI Online Prediction
  • Se presentó una situación en la que es difícil verificar el estado de los servicios personalizados
  • Se reportaron anomalías del servicio que afectan a usuarios en varias regiones
  • Se planteó la necesidad de restaurar el servicio e identificar la causa específica

Resumen de la interrupción

  • Se reportó una indisponibilidad del servicio en Google Cloud Platform
  • En particular, se confirmó la presencia de errores continuos en funciones como Vertex AI Online Prediction

Alcance e impacto actual

  • El problema también está afectando la verificación del estado de servicios como Personalized Service Health
  • Usuarios de distintas regiones están teniendo inconvenientes para acceder o utilizar los servicios

Conclusión y perspectiva

  • Se destaca la necesidad de restablecer el servicio y analizar la causa de la interrupción
  • Se espera un aviso adicional sobre la recuperación concreta y las medidas a tomar

1 comentarios

 
GN⁺ 2025-06-13
Comentarios en Hacker News
  • Explican la situación en la que cayó Chemist, un servicio central interno de Google; Chemist proporciona funciones de verificación de diversas políticas como estado del proyecto, estado de activación, abuso, estado de facturación, restricciones de ubicación, VPC Service Controls, SuperQuota y más, así que se entiende por qué aparecieron varios mensajes de error como “visibility check (of the API) failed” o “cannot load policy”; también comparten un enlace a la documentación de verificación de políticas; EDIT: Google anunció una interrupción en Google Cloud debido a un “Identity and Access Management Service Issue”
    • Yo uso Expo para la función de retransmisión de notificaciones; me pregunto si FCM también se habrá visto afectado por esta caída de Google
    • Varios servicios de internet se cayeron al mismo tiempo; no es un problema exclusivo de GCP; se estima que el servicio Chemist se vio especialmente afectado desde el exterior y que eso provocó un efecto dominó hasta la red interna de GCP
  • Usando Claude Sonnet 4 (Cursor) y Gemini Pro aparecieron muchos errores; lamentan tener que volver a diciembre de 2024 y escribir el código 100% a mano como cavernícolas
    • Yo también tuve el mismo problema en AI Studio, con el mensaje “No se pudo generar contenido porque se excedió la cuota del usuario”
    • Estaba probando subir archivos a Cloud Storage, pero ahora parece un buen momento para salir a caminar
    • En el modo Auto Agent de Cursor también aparecieron errores similares
    • Broma: desarrollador antes del 12 de junio de 2025: “¿IA? ¡Solo es una máquina de alucinaciones, no puede reemplazarme!” / desarrollador durante la caída del 12 de junio de 2025: “¿Entonces sin IA soy un esclavo?”
    • Comparten el tip de que al cambiar a modo Auto todavía se puede usar
  • Cloudflare también está presentando fallas; en Cloudflare status informan interrupciones intermitentes en varios servicios (Access, WARP, Durable Objects (basado en SQL), Workers KV, Realtime, Workers AI, Stream y parte del panel de Cloudflare) y siguen actualizando la evaluación del impacto; comparten también una discusión relacionada en Hacker News
    • Si Cloudflare depende de GCP, entonces esta caída es gravísima
    • Comentaron que el enlace estaba funcionando mal y mencionaron que por un momento apareció vacío
  • A las 18:43 UTC, casi todos los servicios estaban caídos; comparten el enlace de downdetector
    • Parece que los gráficos de ese servicio también recopilan datos internamente desde GCP; mientras hablaban con alguien de Google, alguien dijo que AWS también estaba caído, y luego se arrepienten de haber especulado sin verificar con un “¿será un ataque BGP?”
    • “¿Todos los servicios son servicios de Google?”, preguntan
    • Opinan que no esperaban que una caída de Google afectara también a AWS o Microsoft 365
    • Afirman que, en incidentes grandes como este, Downdetector es una fuente 100% de información falsa
    • Bromean con que probablemente esta lógica de detección también corre en Google Cloud
  • Las páginas de estado muestran todo normal (en verde), pero en realidad se están reportando muchas fallas; comparten el monitor de caídas de Google Cloud
    • Dudan del motivo de existir de las páginas de estado; dicen que más de 100 mil usuarios reportan no poder usar Google Meet, y que si las grandes empresas no reflejan la situación real en esas páginas, entonces no tienen sentido; comparten además Google Apps Status y la página de estado de GCP; EDIT: un minuto después de la publicación, la página de estado de GCP se actualizó y mostró caídas en varios servicios como Cloud Data Fusion, Cloud Memorystore y Cloud Shell
    • Enlace al aviso oficial de esta caída aquí
    • Aquí actualizan la situación de afectación actual en console, dataproc, GCS, IAM, Identity Platform y más: enlace
    • En nuestra empresa también hay cientos de personas trabajando de forma remota, y al entrar a Google Meetings experimentamos errores 504 en más del 90% de los casos
  • La caída de Cloudflare también acaba de actualizarse; servicios esenciales como Workers KV quedaron offline por una interrupción de un servicio de terceros, afectando directamente la entrega de información de los productos de Cloudflare que dependían de ellos
  • Firebase Auth también se cayó y afectó a muchas apps; en las comunidades de Discord y Slack muchos usuarios reportaron haberlo experimentado al mismo tiempo; expresan frustración porque durante casi 30 minutos no apareció nada en la página de estado; Firebase Status
    • Recién ahora se actualizó la página de estado; probablemente una falla interna también retrasó la publicación en esa página
  • Con esta caída también se cayeron los mensajes RCS, lo que dejó muy en evidencia la fragilidad del diseño técnico o de infraestructura
    • ¿RCS no es solo mensajería instantánea? Por eso la caída no sorprende, responden
    • Así que esa era la razón por la que hoy no pude recibir fotos del perro de mis padres
    • Se sorprenden de haber encontrado la respuesta a por qué su chat RCS había fallado hace rato
    • Bromean con que debieron haber usado Erlang
  • Buscan un buen dashboard para comprobar anomalías de enrutamiento BGP; están revisando Cloudflare Radar Routing, pero como no muestra fugas de rutas reales preguntan por más recomendaciones
    • Dicen que es la primera vez que ven Cloudflare Radar y que es un gran servicio, aunque por el impacto actual de la caída suponen que algunos dashboards también podrían estar fallando; recomiendan RIPE Atlas, reporte global de IHR, red de IHR, BGP He.net e IODA dashboard
    • Yo normalmente uso bgp.tools, pero me da curiosidad por qué piensan que esta caída se debió a BGP
    • Yo también soy nuevo en esto y tengo curiosidad: preguntan si es normal que la sección “Announced IP Address Space” dé saltos grandes de repente incluso en tiempos normales
    • Plantean la sospecha de un posible ataque BGP
  • Comentario humorístico: menos mal que Hacker News funciona en un solo servidor bare metal, sin relación con toda esta infraestructura compleja y frágil