- Herramienta de monitoreo basada en IA con el objetivo de automatizar la respuesta a incidentes en entornos Kubernetes
- Usa Claude Code para analizar en tiempo real el estado de los Pods, detectar errores y corregirlos automáticamente o generar reportes
- Se ejecuta periódicamente en forma de CronJob, manteniendo un esquema de respuesta autónoma 24 horas incluso cuando no hay operadores disponibles
- Funciones principales
- Monitoreo del estado de los Pods en el Namespace objetivo
- Detección de estados anómalos como CrashLoopBackOff, Error, etc.
- Identificación de la causa del error mediante análisis de logs
- Si es necesario, ingreso al interior del Pod para aplicar hotfixes
- Registro en una base SQLite y generación de reportes sobre los cambios realizados
- Mediante una configuración de despliegue separada del Dashboard, ofrece visualización del historial de errores y correcciones en una UI web
- Estructura ligera compuesta por Go + HTML + Shell, optimizada para despliegues de Kubernetes CronJob
- Licencia MIT
1 comentarios
Pensé que estaría bueno que existiera algo así, y se ve bastante bien. Si se usa en modo watcher, parece que se puede empezar probándolo de forma segura.