NVBeacon - una app para ver el estado de GPUs NVIDIA remotas desde la barra de menú de macOS
(github.com/jaein4722)Como trabajo en investigación de IA, con frecuencia ejecuto entrenamientos en un servidor GPU compartido. Cada vez, tener que abrir la terminal para revisar nvidia-smi y confirmar si hay una GPU libre, si el proceso de entrenamiento sigue vivo y si está usando bien la util y la memoria se volvía bastante incómodo.
Por eso hice una app que permite ver directamente el estado de un servidor remoto con GPUs NVIDIA desde la barra de menú de macOS. Se conecta al servidor por SSH para obtener la información y funciona sin necesidad de instalar agentes ni programas adicionales en el servidor.
Desde la barra de menú se puede ver al instante el estado de las GPUs del servidor conectado, y también consultar la información por proceso. Además, obtiene el UID de cada proceso, algo que no es fácil de ver de inmediato solo con nvidia-smi, para que sea más intuitivo identificar qué usuario está ejecutando qué trabajo. También procuré aprovechar al máximo la configuración SSH existente y facilitar encontrar rápidamente los procesos que yo mismo estoy ejecutando.
Es una herramienta que hice para uso personal, pero después de pedirles a algunas personas cercanas que la probaran de forma simple, la respuesta fue mejor de lo esperado, así que decidí publicarla. Por ahora es exclusiva para macOS.
Si hay personas que usen con frecuencia servidores GPU en un entorno similar, pruébenla y, si encuentran algo incómodo o necesitan alguna función, les agradeceré mucho su retroalimentación.
2 comentarios
Vaya... de verdad se ve muy útil.
¡Gracias!
Seguimos mejorándolo para que sea cómodo de usar.