1 puntos por p2c2kbf 2026-04-13 | Aún no hay comentarios. | Compartir por WhatsApp

AIWatch es un proyecto open source que monitorea en tiempo real caídas, uptime y tiempos de recuperación de los principales servicios de IA como Claude, OpenAI y Gemini.

Dashboard: https://ai-watch.dev
Landing page: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch

Cuando ocurre una falla, la IA analiza la causa, predice el tiempo de recuperación y envía alertas inmediatas por Discord/Slack.

Hoy publicamos el reporte de confiabilidad de 27 servicios (según marzo) con base en los datos recopilados entre el 20 y el 31 de marzo (12 días). Como es el primer reporte, el periodo es corto; a partir de abril se publicará con los datos de todo el mes.

3 hallazgos clave

1. El porcentaje de uptime es incompleto
Claude API registró 99% de uptime, pero tuvo 9 incidentes en 12 días.
Cohere tuvo 100% de uptime y cero incidentes.
Si solo se miran los números parecen similares, pero la confiabilidad real es totalmente distinta.

2. Los incidentes cortos acumulados se vuelven un gran problema
Together AI fue el que más incidentes tuvo en 12 días, con 20,
pero su tiempo promedio de recuperación fue de 25 minutos y su downtime total fue de 8 horas 37 minutos.
En cambio, ChatGPT tuvo 4, pero uno de ellos duró 19 horas 46 minutos.

3. Riesgo por dependencias upstream
La falla de 74 horas del Voice Agent de Deepgram comenzó con una caída de OpenAI.
Los servicios que montan IA sobre otra IA heredan directamente las fallas del servicio superior.


Top 5 de AIWatch Score (según marzo)

Servicio Score Calificación Incidentes
Cohere API 100 Excellent 0
Hugging Face 100 Excellent 0
OpenRouter 99 Excellent 0
Groq Cloud 93 Excellent 1
DeepSeek API 92 Excellent 1
OpenAI API 88 Excellent 1 (2h 56m)
Together AI 84 Good 20 (prom. 25m)
ChatGPT 73 Good 4 (máx. 19h 46m)
Claude API 59 Fair 9 (agregado por modelo)
ElevenLabs 47 Degrading 2 (máx. 4h 47m)

Fórmula del Score (según el reporte de marzo): Uptime(50) + días con impacto de incidentes(30) + tiempo de recuperación(20) = 100 puntos máximos
Como usa días con impacto (affected_days) en lugar de cantidad de incidentes, permite una comparación justa sin importar la forma de reportar.
Divulgación completa del método de cálculo: https://ai-watch.dev/#about-score

ElevenLabs obtuvo una calificación Degrading con 97.55% de uptime, siendo el único entre los 27 servicios en recibir esa categoría.
Si estás usando servicios de voz/audio en producción, conviene tener precaución.


Notas

  • Como el periodo de monitoreo va del 20 al 31 de marzo (12 días), al ser el primer reporte los datos son parciales.
    A partir de abril se publicará con los datos de todo el mes.

Recomendaciones por caso de uso (según el reporte de marzo)

  • Producción crítica: Cohere (100 puntos, 0 incidentes), OpenAI API (88 puntos, 1 incidente / downtime total de 2h 56m)
  • Baja latencia / estabilidad: Groq Cloud (93 puntos, 100% uptime), DeepSeek API (92 puntos)
  • Flujo de trabajo de programación: Cursor, Windsurf (alto uptime)
  • Voz/audio: se recomienda AssemblyAI + fallback obligatorio (múltiples fallas en ElevenLabs y Deepgram)

Aún no hay comentarios.

Aún no hay comentarios.