使用nvidia smi检查nvidia gpu状态的nagios插件
nagios-nvidia-smi-plugin的Python项目详细描述
此插件通过提供的nvidia smi可执行文件检查nvidia gpu状态 通过英伟达电流。
设置
pip安装nagios nvidia smi插件
/usr/local/bin/check_nvidiasmi.py-h:
usage: check_nvidiasmi.py [-h] [-w RANGE] [-c RANGE] [-W RANGE] [-C RANGE] [-t RANGE] [-T RANGE] [-d DEVICE] [-v] Nagios plugin to check Nvidia GPU status using nvidia-smi optional arguments: -h, --help show this help message and exit -w RANGE, --gpu_warning RANGE warning if threshold is outside RANGE -c RANGE, --gpu_critical RANGE critical if threshold is outside RANGE -W RANGE, --mem_warning RANGE warning if threshold is outside RANGE -C RANGE, --mem_critical RANGE critical if threshold is outside RANGE -t RANGE, --gputemp_warning RANGE warning if threshold is outside RANGE -T RANGE, --gputemp_critical RANGE critical if threshold is outside RANGE -d DEVICE, --device DEVICE Device ID (starting from 0) -v, --verbose increase verbosity (use up to 3 times)
释放量
0.4.0-2015年5月6日:指定要检查的设备,并添加温度检查;谢谢@gslongo! 0.2.0-2013年1月16日:首次发布
开发
把我叉在Github上。