- En la plataforma Claude se reportó un aumento en la tasa de errores de varios modelos
- Los usuarios pueden suscribirse por correo electrónico o SMS para recibir alertas de incidentes y de resolución
- Las alertas por SMS permiten registrar números de distintos países mediante una lista global de códigos de país
- Los suscriptores pueden recibir actualizaciones por SMS tras pasar una verificación con OTP (contraseña de un solo uso)
- Es un caso que muestra el sistema de monitoreo de incidentes del servicio Claude operado por Anthropic
Aviso de incidente del servicio Claude
- En la página de estado de Claude se anunció un estado de alta tasa de errores en varios modelos
- Se muestra con la frase “Elevated errors across many models”
- No se explica la causa específica ni el alcance del impacto
Forma de suscripción a las alertas
- Los usuarios pueden recibir notificaciones de actualizaciones del incidente por correo electrónico o SMS
- El correo electrónico notifica cada vez que el incidente se actualiza
- Los SMS se envían cada vez que Claude crea o resuelve un incidente
Proceso de registro para alertas por SMS
- Para recibir alertas por SMS se requiere el proceso de seleccionar el código de país → ingresar el número de celular → verificación por OTP
- Es necesario ingresar el OTP (contraseña de un solo uso) para validar el número
- Después de la verificación, se pueden recibir actualizaciones por SMS
Lista de países compatibles
- La página incluye una lista de códigos de país de la mayoría de los países del mundo
- Ejemplo: Estados Unidos (+1), Corea del Sur (+82), Japón (+81), Reino Unido (+44), Alemania (+49), etc.
- Los usuarios de cada país pueden recibir alertas por SMS con el mismo procedimiento
Significado del monitoreo del estado del servicio
- La página de estado de Claude funciona como una ventana pública del estado de incidentes en tiempo real de los servicios de Anthropic
- Ofrece a los usuarios una función transparente de alertas de incidentes y seguimiento del progreso de la recuperación
- Es un sistema que permite a desarrolladores y clientes empresariales identificar de inmediato la disponibilidad del servicio
1 comentarios
Opiniones de Hacker News
Me impresionó que actualizaran la página de estado apenas surgió el problema
Estaba usando Claude Code, me salió un error de API, revisé la página de estado y efectivamente ya mostraba la caída
Creo que este tipo de respuesta transparente es algo que todos los servicios deberían hacer por defecto
Justo estaba usando Claude personalmente, así que pude darme cuenta de inmediato de la gravedad de la caída
Parece que los usuarios de Claude trabajan duro incluso el domingo por la noche
Soy uno de los ingenieros de respuesta a incidentes en este caso
A las 14:43 PT / 22:43 UTC ya habíamos mitigado el problema. Disculpen las molestias
Un anuncio de rutas duplicadas hizo que parte del tráfico hacia algunos backends de inferencia cayera en un blackhole
Tardamos unos 75 minutos en detectarlo, y algunas rutas de mitigación no funcionaron como esperábamos
Ya se eliminaron las rutas incorrectas y el servicio se recuperó
En adelante vamos a reforzar el synthetic monitoring y la visibilidad sobre los cambios de infraestructura para detectarlo más rápido
Gracias a esa transparencia terminé confiando más en Cloudflare
Me imaginé una distopía steampunk dentro de 50 años
“El hosting de LLM se detuvo, la producción mundial se paralizó y el mercado colapsó. Sam, ¿me escuchas?”
Solo pensarlo da risa
Video relacionado: YouTube Shorts
Recibí este mensaje en el chat de Claude.ai
O el timing fue increíblemente preciso, o el equipo de monetización merece un bono
Puede que el backend no esté devolviendo errores 429/402, o que el gateway los esté manejando mal y por eso muestre un mensaje incorrecto
Si descontinúan Opus 4.5, creo que voy a llorar
Justo antes de la caída, Opus empezó a dar respuestas extrañamente largas
Incluso a preguntas simples respondía como si estuviera vomitando todo el codebase, y en una pregunta sencilla sobre el esquema de base de datos llegó a comprimir dos veces
canivibe.ai — quizá se pueda mantener la vibra según el servicio que uses
Me pregunto si esto no habrá sido en realidad una caída de AWS
Según la página de estado, ya parece haberse recuperado
Vi que un agente estaba atrapado en el mismo bucle de error y esta vez sí devolvió el resultado correctamente
Me da la impresión de que agregaron una regla para detectar este tipo de fallas automáticamente, y fue una respuesta bastante inspiradora