Falla en GCP

(status.cloud.google.com)

2 puntos por GN⁺ 2025-06-13 | 1 comentarios | Compartir por WhatsApp

El panel de Google Cloud Service Health muestra el estado de los servicios de Google Cloud por producto y ubicación, y la pantalla actual indica sin incidentes graves generalizados
El impacto por proyecto puede no quedar suficientemente cubierto solo con el panel general, por lo que se debe revisar Personalized Service Health para ver alertas personalizadas, datos de API y registros
El alcance de estado se divide en Americas, Europe, Asia Pacific, Middle East, Africa, Multi-regions y Non-regional, y permite ver el estado por producto en el eje de ubicación
Multi-regions son ubicaciones redundantes y distribuidas en varias regiones, mientras que Non-regional indica el estado de servicios desplegados globalmente que no pertenecen a una región específica
Se ofrecen historial de incidentes, RSS, JSON History y JSON Product Catalog; la hora mostrada está en US/Pacific y la última actualización fue el 3 de julio de 2026 a las 12:35 PDT

Estado actual de Google Cloud

Google Cloud Service Health proporciona información de estado de los servicios de Google Cloud
El estado en la parte superior del panel aparece como No broad severe incidents
Se indica revisar en la vista por cuenta los eventos que podrían afectar a un proyecto
La hora de la última actualización es 3 de julio de 2026, 12:35 PDT

Verificación de fallas por proyecto

Personalized Service Health muestra con más detalle los incidentes que afectan a proyectos de Google Cloud
- Alertas personalizadas
- Datos de API
- Registros
La verificación del estado por cuenta se realiza ingresando a la cuenta de Google Cloud

Estructura de estado por producto y ubicación

El panel permite revisar el estado por producto dividido por ubicación
- Americas
- Europe
- Asia Pacific
- Middle East
- Africa
- Multi-regions
- Non-regional
Multi-regions son ubicaciones de servicio administradas por Google para ser redundantes y distribuidas en varias regiones dentro de una zona geográfica amplia
Non-regional indica el estado de servicios desplegados globalmente, no de una ubicación específica
- Las actualizaciones en esta área indican un problema del servicio correspondiente
- No significan necesariamente una falla de toda la plataforma que afecte a todas las regiones

Notación de estado y servicios incluidos

La leyenda de estado incluye Available y Multiple regions affected
La tabla de estado incluye varios productos de Google Cloud
- Google Compute Engine
- Google Kubernetes Engine
- Google Cloud Storage
- Google BigQuery
- Cloud Run
- Cloud SQL
- APIs y servicios relacionados con Vertex AI
- IAM, VPC, Cloud Logging, Cloud Monitoring, etc.
Cada producto está organizado para revisar también su estado por ubicación

Historial de incidentes y acceso a datos

En View incident history se puede ver el historial de incidentes
Los datos de estado se ofrecen en varios formatos
Se indica revisar los incidentes relacionados con Google Security Products en una página de estado separada
También se indica revisar los incidentes relacionados con Looker original en una página de estado separada

1 comentarios

GN⁺ 2025-06-13

Opiniones de Hacker News

Parece que Chemist, un servicio central de Google, se cayó
"Chemist checks the project status, activation status, abuse status, billing status, service status, location restrictions, VPC Service Controls, SuperQuota, and other policies."
Eso explica errores como "visibility check (of the API) failed" y "cannot load policy", además del impacto amplio en los servicios
Referencia: https://cloud.google.com/service-infrastructure/docs/service...
Además, Google declaró que "(Google Cloud) is down due to Identity and Access Management Service Issue"
- No solo GCP, también se cayeron varios servicios de internet
  Es posible que este servicio Chemist haya sido especialmente afectado por dependencias externas, y que la falla se haya propagado incluso a servicios internos de red de GCP
- Uso retransmisión de Expo para las notificaciones y, en este contexto de Google, me pregunto si FCM también podría verse afectado
Hay muchos errores en Claude Sonnet 4(Cursor) y Gemini Pro
No puede ser, parece que ahora tendré que volver a usar el cerebro y escribir el 100% del código yo mismo, como un cavernícola de diciembre de 2024
- También ocurre el mismo problema en AI Studio: Failed to generate content: user has exceeded quota. Please try again later.
- Estaba probando la carga de archivos a Cloud Storage, así que parece un buen momento para salir a caminar
- También hay errores en el modo Auto Agent de Cursor
- Desarrolladores antes del 12 de junio de 2025: "¿IA? Bah, es un montón de alucinaciones. ¡Jamás me va a reemplazar!"
  Desarrolladores durante la caída de GCP el 12 de junio de 2025: "¿Cómo que no hay IA? ¿Creen que soy esclavo o qué?"
- openrouter.ai tampoco carga
Cloudflare también se cayó. Según https://www.cloudflarestatus.com:
"Update - We are seeing a number of services suffer intermittent failures. We are continuing to investigate this and we will update this list as we assess the impact on a per-service level."
Los servicios afectados son Access, WARP, Durable Objects basados en SQLite, Workers KV, Realtime, Workers AI, Stream y partes del panel de Cloudflare
12 de junio de 2025, 18:48 UTC
Adicional: https://news.ycombinator.com/item?id=44261064
- Si Cloudflare usa GCP como dependencia crítica, parece un WTF bastante serio
A las 18:43 UTC, parecía que casi todo estaba caído: https://downdetector.com/
- Sí. Creo que los gráficos de ese servicio probablemente eran resultados detectados dentro de GCP
  Durante una llamada con personal de Google, alguien dijo que "AWS también estaba caído", y antes de comprobar directamente la disponibilidad de AWS, solté innecesariamente que "podría ser un ataque BGP". Qué vergüenza
- Es interesante porque no esperaba que una caída de Google afectara incluso a AWS o Microsoft 365
- Tal vez la lógica de detección corre en Google Cloud /s
- En incidentes así, Downdetector difunde información errónea el 100% de las veces
La página de estado está en verde, pero ya están llegando reportes de fallas: https://downdetector.com/status/google-cloud/
- Si va a ser así, no entiendo para qué tienen una página de estado
  También hubo reportes de organizaciones con más de 100 mil usuarios que no podían usar Google Meet. Si las empresas no van a actualizar sus páginas de estado, mejor que no tengan una
  https://www.google.com/appsstatus/dashboard/
  https://status.cloud.google.com/index.html
  Actualización: menos de 1 minuto después de publicar esto, la página de estado de GCP se actualizó y muestra como servicios afectados a Cloud Data Fusion, Cloud Memorystore, Cloud Shell, Cloud Workstations, Google Cloud Bigtable, Google Cloud Console, Google Cloud Dataproc, Google Cloud Storage, Identity and Access Management, Identity Platform, Memorystore for Memcached, Memorystore for Redis, Memorystore for Redis Cluster y Vertex AI Search
- El enlace del incidente está aquí: https://status.cloud.google.com/incidents/ow5i3PPK96RduMcb1S...
- No entiendo por qué a las empresas les cuesta tanto admitir honestamente una caída. Así no pasamos una hora dando vueltas pensando que era un problema interno
  Estamos literalmente en manos de Dios
  $ prod
  Fetching cluster endpoint and auth data.
  ERROR: (gcloud.container.clusters.get-credentials) ResponseError: code=503, message=Visibility check was unavailable. Please retry the request and contact support if the problem persists
- En una empresa remota de cientos de personas, el acceso a Google Meetings está fallando en más del 90% de los casos. Al entrar a una reunión, simplemente aparece un 504
- Ya se actualizó y muestra impacto en Console, Dataproc, GCS, IAM e Identity Platform: https://status.cloud.google.com/incidents/ow5i3PPK96RduMcb1S...
Es raro que por esta caída también se haya caído la mensajería RCS. Muestra lo endeble que es el diseño técnico o de infraestructura
- ¿RCS no es básicamente mensajería instantánea? No entiendo por qué sorprende que se caiga
- Con razón hoy no pude recibir la foto del perro de mis papás
- Dios mío, ¿entonces por eso falló mi chat RCS hace rato?!
La autenticación de Firebase está caída y está afectando a muchas apps. En grupos de Discord y Slack también están llegando montones de confirmaciones iguales
Que durante casi 30 minutos no haya nada en la página de estado es bastante decepcionante: https://status.firebase.google.com/
- Acaba de actualizarse. Probablemente se vieron afectados por su propia caída
La caída de Cloudflare también acaba de actualizarse
"Cloudflare’s critical Workers KV service went offline due to an outage of a 3rd party service that is a key dependency. As a result, certain Cloudflare products that rely on KV service to store and disseminate information"
- ¿Ese servicio de terceros será GCP?
Me pregunto si alguien conoce un buen dashboard para revisar una anomalía de ruteo BGP como la que parece estar ocurriendo ahora
Estoy revisando https://radar.cloudflare.com/routing, pero no muestra qué rutas se filtraron realmente
Me gustaría recibir recomendaciones de buenas herramientas
- Creo que es la primera vez que veo CF Radar, y está bastante genial
  También hay otras herramientas. Aunque algunas parecen tener problemas, quizá por la caída actual
  https://atlas.ripe.net/probes/public
  https://www.ihr.live/en/global-report
  https://www.ihr.live/en/network
  https://bgp.he.net/
  https://ioda.inetintel.cc.gatech.edu/dashboard/asn
- El sitio que reviso primero por defecto es este: https://bgp.tools/
  Pero me da curiosidad por qué pensaste que esta caída tenía que ver con BGP en Internet
- Yo también soy principiante en este tema, pero me pregunto si es normal que en la sección "Announced IP Address Space" el número de direcciones salte tanto así
- ¿Será un ataque BGP?
Menos mal que HN está alojado en un solo servidor bare metal, sin todas estas cosas infladas
- Recuerdo bastantes ocasiones en las que HN también se cayó

Falla en GCP

Estado actual de Google Cloud

Verificación de fallas por proyecto

Estructura de estado por producto y ubicación

Notación de estado y servicios incluidos

Historial de incidentes y acceso a datos

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News