nvidia-smi命令参数解释
nvidia-smi
-
nvidia-smi
用于监控和管理NVIDIA GPU的状态和性能
字段 说明 NVIDIA-SMI nvidia-smi 的版本号 Driver Version 驱动版本号 CUDA Version CUDA 版本号 GPU GPU 卡序号(第0个,第1个。。。) Name GPU 的名称和内存容量 Persistence-M 持久模式是否启用。On 表示启用, Off 表示关闭。启用时 GPU 将保持最大性能状态 Bus-Id GPU 所在的 PCIe 总线地址 Disp.A 显示器是否连接到 GPU 的输出端口。On 表示连接,Off 表示没有连接 Volatile Uncorr. ECC 显存的错误纠正码(ECC)状态。 Fan 风扇速度, N/A 表示没有风扇或风扇速度读数 Temp GPU 温度 Perf 性能状态。P0 是最大性能状态, P8 是最小性能状态 Pwr Usage/Cap: 当前功耗和功耗上限 Memory-Usage 已用 GPU 显存/总 GPU 显存 GPU-Util GPU 利用率 Compute M. 计算模式。Default 是默认模式 MIG M. MIG(Multi-Instance GPU) 模式, 将一个物理 GPU 分成多个独立、隔离的实例。Disabled 表示未启用 GPU GPU 设备的 ID GI Global ID, 针对多 GPU 系统, 一个进程所有的 cuda context 的统一 ID CI Compute Instance ID, 属于同一个 GPU 进程内, 区分不同 cuda context 的 ID PID 进程 ID Type 进程类型, C 表示 CUDA 进程, G 表示 Graphics 进程 Process name 进程名称 GPU Memory Usage 该进程当前在 GPU 上占用的内存大小
参数
-
查询详细信息
nvidia-smi -q
-
查询指定GPU详细信息
nvidia-smi -q -i 0
-
查询指定GPU的特定信息
nvidia-smi -q -i 0 -d MEMORY
-
帮助命令
nvidia-smi -h