当前位置: 首页 > news >正文

Ubuntu 22.04 安装Nvidia驱动加速deepseek

一键安装22.04 nvidia 驱动

  • nvidia 官网下载驱动
  • 我的环境是NVIDIA RTX A5000
  • nvidia 文档参考
  • 没有安装驱动之前确认自己的型号 lspci | grep -i vga (如数字2231) 参考
  • docker 支持nvidia ,注释了需要的取消注释即可 42行-92行
  • 一定要重启服务器哦,不然驱动不会生效的reboot
vim /nvidia_install.sh
#!/bin/bash
# -*- coding: utf-8 -*-
# Author: CIASM
# update 2025/02/27
# make.ha

<<!
# check nvidia
lspci | grep -i vga
http://pci-ids.ucw.cz/mods/PC/10de/2204

#add-apt-repository ppa:graphics-drivers/ppa
!

echo "remove nvidia"
apt remove -y nvidia*

echo "add nvidia repo"
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
	sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

echo "check host nvidia"
ubuntu-drivers devices

echo "install nvidia"
apt-get update
apt install -y nvidia-driver-535

echo "install docker NVIDIA GPU"
apt install -y nvidia-container-toolkit

echo ""
nvidia-ctk runtime configure --runtime=docker
systemctl restart docker

echo "install NVIDIA CUDA Toolkit"
apt install -y nvidia-cuda-toolkit

echo "nvidia persist mode"
nvidia-smi -pm 1

# docker 支持 nvidia 配置
<<!
echo "docker daemon.json"
rm -rf /etc/docker/daemon.json 
cat <<'EOF'>>/etc/docker/daemon.json
{
  "registry-mirrors": [
    "https://registry.hub.docker.com",
    "https://ccr.ccs.tencentyun.com",
    "https://dockerproxy.com",
    "https://hub-mirror.c.163.com",
    "https://docker.mirrors.sjtug.sjtu.edu.cn",
    "https://docker.nju.edu.cn",
    "https://registry-k8s-io.mirrors.sjtug.sjtu.edu.cn",
    "https://docker.m.daocloud.io",
    "https://docker.mirrors.ustc.edu.cn",
    "https://mirror.iscas.ac.cn",
    "https://s64h8lpn.mirror.aliyuncs.com",
    "https://atomhub.openatom.cn",
    "https://mirror.baidubce.com",
    "https://docker.1panel.live",
    "https://proxy.1panel.live",
    "https://image.cloudlayer.icu",
    "https://docker-0.unsee.tech",
    "https://docker.tbedu.top",
    "https://pull.loridocker.com",
    "https://docker.melikeme.cn",
    "https://docker.imgdb.de",
    "https://docker.hlmirror.com",
    "https://docker.kejilion.pro",
    "https://hub.rat.dev",
    "https://dockerpull.pw",
    "https://hub.fast360.xyz",
    "https://docker.xuanyuan.me",
    "https://docker.1ms.run",
    "https://xdark.top",
    "https://func.ink",
    "https://lispy.org"
  ],
  "insecure-registries": [
    "192.168.11.40"
  ],
  "runtimes": {
    "nvidia": {
      "args": [],
      "path": "nvidia-container-runtime"
    }
  }
}
EOF

echo "restart docker"
systemctl restart docker

echo "test cuda docker"
docker run --rm --gpus all nvidia/cuda:12.2.0-base-ubuntu22.04 nvidia-smi
!

一键安装nvidia 驱动

  • 一定要重启服务器哦,不然驱动不会生效的reboot
bash /nvidia_install.sh

 查询安装完成的nvidia驱动情况

nvidia-smi

nvidia 持续模式

  • 持久模式(-pm)允许用户将 NVIDIA-SMI 设置持久化,即使在系统重启后也能生效。这意味着,您可以在会话期间配置设备,而无需每次重新启动系统时都手动重新应用设置。
  • 1:启用持久模式
  • 0:禁用持久模式
  • 立即生效
echo "nvidia persist mode"
nvidia-smi -pm 1

nvidia ECC 校验开启和关闭

  • ECC(错误纠正代码)是一种用于检测和纠正设备内存错误的技术。启用 ECC 可以提高系统稳定性,防止因内存错误而导致的数据损坏。
  • 1:启用 ECC
  • 0:禁用 ECC
  • reboot 系统生效
nvidia-smi -e 1

重置 ECC 错误计数(-p) 

  • -p 选项用于重置 ECC 错误计数器。如果 ECC 已启用,此计数器将跟踪检测到的内存错误数量。重置计数器可以帮助您监测和排除故障,并确保您收到设备错误的最新信息。
  • 0/VOLATILE,
  • 1/AGGREGATE
nvidia-smi -p 0

相关文章:

  • 大模型RAG中的retrieve策略
  • AE 安装包 绿色版(Win,Mac)(2018-2025)合集
  • conda env remove与conda remove
  • RuoYi使用$.modal.closeTab方法关闭当前tab标签页刷新另外一个tab标签页
  • Python毕业设计选题:基于Python的社区爱心养老管理系统设计与实现_django
  • 国漫工业化革命:AI如何让“一人团队”产出影视级动画?
  • Bend Labs弯曲传感器:柔性设计,多轴测量,高精度传感
  • 时间无关和时间相关的N-S方程
  • 凸函数和凹函数的定义怎么来的?
  • openssl的aes128_ECB加密解密运算实例
  • 【精】使用 Apktool 反编译 APK 并重新签名的详细教程
  • 工具MyBatis Generator(MBG)
  • 网页聊天室测试报告
  • ubuntu下r8125网卡重启丢失修复案例一则
  • 使用 Java 更新 Word 文档中的图表数据-超详细
  • Qt 对象树详解:从原理到运用
  • 多线程之旅:锁策略
  • C++中map容器常见用法(AI)
  • 游戏引擎学习第127天
  • Spring Boot 集成 EasyExcel 导出 Excel 文件【复杂表头】
  • 网站规划与开发技术/同城推广有什么平台