GPU-Usage-Audit: ¿Y si la GPU no está simplemente ociosa, sino 'apartada' sin usarse?
(github.com/AI-Ocean)Si en nvidia-smi aparece un util de 1%, la tarjeta parece libre,
pero si alguien dejó apartados 8 GB en un notebook de Jupyter y se fue, nadie más puede usar esa GPU.
Es un desperdicio invisible en servidores compartidos o en GPUs cobradas por hora.
Por eso hicimos GPU-Usage-Audit.
Si solo tienes instalado el driver de NVIDIA, registra las métricas de la GPU en SQLite y luego las genera en un reporte.
El reporte divide el tiempo de uso de la GPU no en dos, sino en tres partes.
El tiempo en que realmente está computando, el tiempo en que está completamente libre, y el tiempo idle-held, en el que la memoria está apartada pero no se está computando.
La mayoría de las herramientas juntan las dos últimas categorías, pero justo ahí es donde se esconde el desperdicio.
Convierte el tiempo apartado a GPU-hours y, si se está ejecutando por usuario, también muestra quién está ocupando cuánto.
¡La instalación y ejecución es en una sola línea!: uv tool install gpu-usage-audit && gua daemon
Después de acumular datos, basta con ejecutar gua report para ver el reporte,
Y si quieres ver primero el resultado sin datos, puedes probar con datos falsos usando gua demo.
Aún no hay comentarios.