当前位置: 首页 > news >正文

ubuntu 服务器(带NVLink)更新显卡驱动 (巨坑!!)

如果你使用的是大型的带NVLink的GPU服务器,例如H100\H20\A100等,就不要去学那些普通服务器或个人电脑的显卡驱动更新的教程,因为不一样!很容易导致更新后,nvidia-fabricmanager 的版本和驱动对不上,而且 apt-get 根本找不到对应的版本!
正确步骤:

1. 卸载原有驱动

apt-get --purge remove "*nvidia*" -y  

2. 下载 Data Center 驱动

注意要下载Data Center 驱动而不是普通显卡驱动。去官网,选择想要的版本,按照官网步骤(如下图所示)做完(直到做完 apt-get install -y nvidia-open-570这一步),那么此时驱动安装完毕
在这里插入图片描述

3. 下载 nvidia-fabricmanager

NVLink的服务器必须安装nvidia-fabricmanager,不然即使nvidia-smi可以看到GPU,使用torch时也检测不到GPU
安装的nvidia-fabricmanager必须和nvidia-driver版本号严格对应,安装前可以先检查可安装的版本是否和driver对得上:

apt-cache policy nvidia-fabricmanager-570

如果能找到正确版本,则安装它:

apt-get install -y nvidia-fabricmanager-570

最后重启

reboot

4. 开启nvidia-fabricmanager

重启后需要开启fabricmanager服务,参考此篇

sudo systemctl enable nvidia-fabricmanager   # 配置Fabric Manager服务随实例开机自启动
sudo systemctl start nvidia-fabricmanager    # 启动Fabric Manager服务
sudo systemctl status nvidia-fabricmanager    # 查看Fabric Manager服务是否正常启动,回显active(running)表示启动成功

然后使用nvidia-smi检查显卡,使用 torch.cuda.is_available() 检测显卡,如果没问题则大功告成。

http://www.dtcms.com/a/434358.html

相关文章:

  • jQuery提供了多种选择器,可以快速获取DOM元素
  • 【LaTeX】 6 LaTeX 扩展功能
  • 软件测试基础-03(缺陷)
  • 重庆建设公司网站做网站的工作好吗
  • GitHub 热榜项目 - 日榜(2025-10-02)
  • PEFT实战LoRA微调OpenAI Whisper 中文语音识别
  • Django第三方扩展详解:提升开发效率的利器
  • 正能量不良网站直接进入自助建站系统模板
  • 考研复习-线性代数强化-向量组和方程组特征值
  • Chromium 138 编译指南 - Android 篇:环境搭建与准备(一)
  • 2023 年真题配套词汇单词笔记(考研真相)
  • Android 窗口结构(三) Home Task 添加Home ActivityRecord
  • 峨边网站建设网站iis安全配置
  • CMU与谷歌提出FM-SIREN:受奈奎斯特定理启发,让神经元“各司其职”,特征冗余降低50%
  • 【软件安全】fgets / strncpy / gets(不安全) / snprintf的对比
  • 济南免费做网站四平网站建设联系方式
  • 向量数据库前沿:Faiss 向量数据库的配置与使用
  • 机床铸铁底座在高端机床行业中的核心作用
  • 我为您整理出了 Coolify 可以添加的所有服务类型,并附上其用途说明。
  • 《回溯 C++98:string 核心机制拆解 —— 从拷贝策略到高效 swap》
  • JAVA过时了吗?
  • fnos安装并更新最新版sunpanel(显示为套件)
  • 资阳网站建设资阳河南郑州地图
  • 【Java初学基础11】Annotation-注解
  • OSPF LSA Type 2(Network LSA)概念及题目
  • OSPF 伪节点(Transit Node) 概念及题目
  • Android 开发 | 提取已安装应用的安装包 apk 的方式
  • 商务网站建设步骤犀牛云网站怎么建设
  • Vite 前端构建工具入门教程
  • 一种利用 qBittorrent 的 WebUI API 实现的检查BT种子的磁力链接是否可用的程序