当前位置: 首页 > news >正文

服务器查看 GPU 占用情况的方法

在 Linux 系统中查看 GPU 占用情况,主要取决于你的 GPU 类型(NVIDIA/AMD),以下是常用方法:

一、NVIDIA GPU(最常用,如 RTX 系列、Tesla 系列)

使用 NVIDIA 官方工具 nvidia-smi(需安装 NVIDIA 驱动):

1. 基本查看

直接在终端运行:

nvidia-smi

输出内容包含:

  • GPU 编号、名称、驱动版本
  • 显存使用情况(Total/Used/Free)
  • GPU 利用率(GPU-Util)
  • 温度(Temperature)
  • 占用 GPU 的进程(PID、进程名、显存占用)
2. 实时监控(每秒刷新)
watch -n 1 nvidia-smi  # 1秒刷新一次,按Ctrl+C退出
3. 更简洁的输出
nvidia-smi --query-gpu=name,memory.total,memory.used,memory.free,temperature.gpu,utilization.gpu --format=csv

自定义需要的参数(更多参数可通过 nvidia-smi --help-query-gpu 查看)。

二、AMD GPU

使用 ROCm 工具链中的 rocm-smi(需安装 ROCm 驱动):

1. 基本查看
rocm-smi

输出包含 GPU 型号、温度、显存使用、利用率等信息。

2. 实时监控
watch -n 1 rocm-smi

三、通用工具(支持多品牌)

1. gpustat(更友好的命令行工具)
  • 安装:pip install gpustat(需要 Python 环境)
  • 使用:
gpustat  # 简洁显示GPU状态gpustat -i  # 显示进程详情(如PID和进程名)watch -n 1 gpustat  # 实时监控
2. glances(系统监控工具,支持 GPU)
  • 安装:sudo apt install glances(Ubuntu/Debian)
  • 使用:运行 glances,在界面中找到 GPU 相关指标(需系统支持)。

四、注意事项

  1. nvidia-smi 提示命令不存在,说明未安装 NVIDIA 驱动,需先安装对应版本的驱动。
  2. 对于服务器级 GPU(如 Tesla),输出内容可能包含更多功耗、性能状态等信息。
  3. 若需查看特定进程占用的 GPU 资源,可结合 ps 命令进一步分析,例如:
ps -p \<PID> -o %cpu,%mem,cmd  # 查看某个PID的CPU/内存占用

根据你的 GPU 类型选择对应工具即可快速掌握 GPU 的占用情况。

http://www.dtcms.com/a/328815.html

相关文章:

  • mac环境下安装git并配置密钥等
  • 搜索引擎核心机制解析
  • RabbitMQ面试精讲 Day 21:Spring AMQP核心组件详解
  • 详解Windows(二十)——恶意软件清除
  • CV 医学影像分类、分割、目标检测,之【腹腔多器官语义分割】项目拆解
  • 1.4.2 嵌入(embedding)模式:让人工智能大模型为你的产品或业务助力
  • 大模型微调【1】之入门
  • 实践基地授牌:重庆五一职院与成都影像产业园强实训
  • Coze Studio 概览(十)--文档处理详细分析
  • CW32L011电机开发板控制教程
  • C++ 面向对象四大特性:面试深度解析
  • 一个接口多个实现类,如何动态调用
  • 神经网络的核心组件解析:从理论到实践
  • ARM 实操 流水灯 按键控制 day53
  • Django REST Framework视图
  • HarmonyOS NDK的JavaScript/TypeScript与C++交互机制
  • Flask vs Django:微框架与一站式对决
  • web安全开发,在线%射击比赛管理%系统开发demo,基于html,css,jquery,python,django,三层mysql数据库
  • C# 异常处理与拦截全攻略:try/catch/finally、using、ASP.NET Core 中间件与过滤器一网打尽(含完整示例)
  • tRAP(tRNA 活性预测器)
  • Java开发主流框架搭配详解及学习路线指南
  • 二叉树的最小深度
  • Android 终端接入 GB28181 国标视频平台的完整解决方案解析
  • 【安卓,问题记录】ImageView 在布局顺序上位于 Button 上方,却出现图像内容被 Button 遮挡
  • AIOPS人才需具备的技术需求
  • 【完整源码+数据集+部署教程】火柴实例分割系统源码和数据集:改进yolo11-rmt
  • latex中“itemize”
  • 如何写出高质量的dify参数提取器prompt
  • 【P21】OpenCV Python——RGB和BGR,HSV和HSL颜色空间,及VScode中报错问题解决
  • vscode扩展应用 -koroFileHeader(jsdoc代码风格注释)