ubuntu22.04安装显卡驱动与cuda+cuDNN
背景:
紧接前文:Proxmox VE 8.4 显卡直通完整指南:NVIDIA 2080 Ti 实战。在R740服务器完成了proxmox的安装,并且安装了一张2080ti 魔改22g显存的的显卡。配置完了proxmox显卡直通,并将显卡挂载到了vm 301(ubuntu22.04)的虚拟机上面。现在需要安装显卡驱动与cuda以及cuDNN!
ubuntu22.04安装显卡驱动与cuda+cuDNN
下载并安装显卡驱动
下载显卡驱动到虚拟机实例
登录NVIDIA驱动官方网站,输入对应产品型号,选择操作系统,开始搜索:
这里直接下载了最新的570.144 版本驱动,点击获取下载:
点击立即下载通过浏览器下载驱动到本地:
通过rz or其他ftp工具上传驱动程序到VM301实例:
我这里使用rz上传了驱动程序到/data/soft目录下了,这里的操作全凭喜好,并给驱动程序增加可执行权限:
mkdir -p /data/soft
cd /data/soft
chmod +x NVIDIA-Linux-x86_64-570.144.run
安装所需依赖
sudo apt-get update
sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make
注:如果没有安装如上依赖执行驱动可执行程序会报错 gcc 等依赖的错误:
卸载原有 NVIDIA 驱动(如果有)
sudo apt-get remove --purge nvidia*
禁用 nouveau (通用驱动程序)
编辑/etc/modprobe.d/blacklist.conf文件,在末尾添加以下两行,保存后关闭文本
blacklist nouveauoptions nouveau modeset=0
在终端输入如下更新,更新结束后重启电脑(必须)
sudo update-initramfs -u
reboot
重启后输入如下指令,如无输出则已关闭 nouveau
安装显卡驱动
进入驱动可执行文件存放目录,执行可执行程序:
cd /data/soft/
./NVIDIA-Linux-x86_64-570.144.run
图像框默认即可,安装页面如下:
具体过程截图太多,只保留最后的截图:
验证驱动 程序安装成功:
nvidia-smi
根据显卡驱动,下载安装对应的 CUDA
下载并安装cuda
通过nvidia-smi 可以看到显卡最高支持的cuda版本是 12.8,访问cuda下载页面 点击 12.8.0对应链接:
选择自己的操作系统、芯片架构、Linux发行版本、安装方式:
我这里创建了一个目录存放cuda对应deb包,并执行官方提供的安装命令:
mkdir /data/soft/cuda
cd /data/soft/cuda
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-8
配置环境变量并验证cuda:
vi ~/.bashrc 到尾行增加如下配置
export PATH=/usr/local/cuda-12.8/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH
刷新bashrc 文件,并验证cuda是否安装成功:
source ~/.bashrc
nvcc –V
根据 CUDA版本,下载对应的 cuDNN 库
cuDNN 是 NVIDIA 专门为深度学习任务开发的加速库,cuDNN 需要和上面安装的 CUDA 版本对应起来:
访问cuDNN 下载页面,依然下载最新的了 v8.9.7版本:
下载linux_x86_x64版本到本地并上传到服务器(这里貌似需要登录NVIDIA账号):
解压 cuDNN 文件
mkdir /data/soft/cuDNN
cd /data/soft/cuDNN
tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
将以下文件复制到 CUDA 目录(<font style="color:rgb(199, 37, 78);background-color:rgb(249, 242, 244);">/usr/local/cuda/</font>
文件夹下面的 <font style="color:rgb(199, 37, 78);background-color:rgb(249, 242, 244);">include</font>
和 <font style="color:rgb(199, 37, 78);background-color:rgb(249, 242, 244);">lib64</font>
)
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
验证是否安装成功
sudo cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
注意:
以上步骤操作用户为root,包括环境变量的配置环境变量都为root用户,如使用其他用户,请注意增加对应环境变量配置!