【CUDA】ubuntu环境下安装cuda
写在前面
-
软硬件匹配问题
:如老显卡安装ubuntu24, 会发现适合显卡的cuda不适合ubuntu24, 适合ubuntu24的cuda不适合显卡,因此安装ubuntu系统前,务必查明 :当前设备的显卡支持的cuda,支持哪些ubuntu版本 -
下面的三个问题是一体的,直接看具体实现就行,是完整安装cuda的流程,在新安装的ubuntu系统中已跑通
-
笔者环境:ubuntu 22.04,显卡GTX 1650,cuda 12.2,显卡驱动 535
主要存在问题
- 副屏闪烁,白屏
ubuntu自带显卡驱动存在问题,在设置里的多显示器中可以发现副屏的刷新率不是整数 - 安装显卡驱动报错
需要先打开魔法再安装,装很快大概没装完整 - 安装cuda驱动报错
需要先安装nvidia显卡驱动,在安装cuda驱动时取消安装nvidia driver和nvidia-fs即可(部分cuda版本可能没有nvidia-fs选项,忽略即可)
具体实现
-
安装显卡驱动
# 彻底清理残留驱动 sudo apt-get autoremove --purge nvidia* # 清除所有NVIDIA相关包 sudo rm -rf /usr/lib/nvidia* # 删除残留驱动文件 sudo rm -rf /etc/modprobe.d/nvidia* # 清除驱动配置 # 禁用开源驱动 nouveau # 检查是否加载了nouveau lsmod | grep nouveau # 如果输出存在,执行以下命令: echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf sudo update-initramfs -u # 此时会发现副屏黑了,这是正常的,完整装完显卡驱动就好了 # 先打开魔法,确定能ping通外网,再执行下一步 # 注意看上一行 # 千万不要忽略我的注释 # 记得打开魔法!这一步安装失败不会报错的 sudo apt install nvidia-driver-535 sudo reboot # 检查驱动版本,通常有信息输出,没报错,副屏恢复正常 就算安装成功了 nvidia-smi # 应显示正常输出 modinfo nvidia | grep ^version # 确认内核模块版本与库版本一致
-
安装cuda
在nvidia官网查找适合自己显卡硬件的驱动红色框中的版本号就是显卡支持的cuda版本,根据这个版本下载即可
像我这里,下载12.2.0,12.2.1, 12.2.2都是可以的(用魔法下载会快很多)
根据自己的环境选项,然后使用自己的指令下载.run文件即可,指令位置如图所示,先确定再抄作业
下好的.run文件大概在根目录~/下
在该目录下打开终端,执行sudo sh cuda_12.2.2_535.104.05_linux.run
然后跟着下图流程走
取消driver和kernel,没有kernel可以不管
等待安装完成即可,安装成功会打印一个summary,并且可以在下图的路径中找到被安装的驱动
-
添加环境变量,保证后续程序、终端等能正确找到cuda
sudo vim ~/.bashrc
在打开的配置文件文末添加如下配置信息并保存(将下面指令中的
12.2
换成你的cuda版本号)export PATH=/usr/local/cuda-12.2/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} export CUDA_HOME=/usr/local/cuda-12.2
应用更改
source ~/.bashrc sudo ldconfig nvcc -V
有如下输出则说明cuda已经可以正常使用了