LinuxNvidia显卡驱动, cuda工具包,驱动包版本记录
0. 情况说明
Ubuntu关于显卡驱动,nvcc显示的cuda工具包版本,显卡驱动可以支持cuda驱动包的最高版本,Pytorch实际使用的cuda版本等等非常乱…
首先,我们需要理清楚CUDA版本之间的关系以及它们如何与PyTorch和系统驱动配合。
- PyTorch的cu118表示它是用CUDA 11.8编译的。
- 那为什么
nvcc --version
显示的是10.1呢?这可能是因为系统中有多个CUDA版本,而nvcc指向的是旧版本。 - CUDA工具包和驱动程序之间有什么关系呢?
- CUDA有两个主要部分:驱动程序和工具包。驱动程序由NVIDIA的显卡驱动提供,而工具包包括nvcc等编译工具。可能我安装的CUDA工具包版本是10.1,而显卡驱动支持更高的CUDA版本。比如,显卡驱动版本决定了支持的最高CUDA工具包版本。比如,如果驱动是535,可能支持CUDA 12.x。那我的显卡驱动版本是多少呢?可以通过nvidia-smi查看,右上角显示的CUDA版本应该是驱动支持的最高版本。
1. 确认驱动支持的CUDA版本
在Ubuntu系统上管理多个CUDA
版本时,需理清驱动支持、工具包版本和环境变量配置的关系。以下是分步解决方案:
nvidia-smi
查看右上角的 CUDA Version
,例如显示 12.4
,表示驱动支持最高到CUDA 12.4
的运行时。PyTorch
使用的CUDA
运行时基于驱动,而nvcc
版本是工具包编译版本。
2. 检查已安装的CUDA工具包
ls /usr/local | grep cuda
输出可能包含 cuda-10.1、cuda-11.8、cuda-12.4 等。若已安装所需版本(如11.8或12.x),直接跳到步骤4配置环境变量;否则继续安装。
3. 安装所需的CUDA工具包
假设需要安装 CUDA 11.8(对应PyTorch的cu118)或 CUDA 12.x:
访问 CUDA Toolkit Archive,在官方网址下载对应版本(如11.8.0)。
关闭图形界面,运行安装:
sudo sh cuda_11.8.0_520.61.05_linux.run
安装时取消勾选驱动安装(保持现有驱动),仅安装工具包。
4. 配置环境变量
方法1:
在 ~/.bashrc 中设置路径指向新版本(例如CUDA 11.8):
export PATH=/usr/local/cuda-11.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH
生效配置:
source ~/.bashrc
有可能直接在安装run文件的时候就会帮助创建好symbol link
方法2(推荐):
在/usr/local路径下设置cuda的软连接指向具体版本,在~/.bashrc中统一使用
设置软连接:
sudo ln -s /usr/local/cuda-11.8 ./cuda
~/.bashrc设置:
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
生效配置:
source ~/.bashrc
5. 验证工具包版本
nvcc --version
此时应显示新安装的版本(如11.8)。若仍显示旧版本,检查路径是否正确,或使用 which nvcc 确认调用的位置。
6. 安装依赖库
配置正确CUDA版本后,重新安装目标库:
pip install your_library
若库需要编译,确保其检测到新的nvcc版本。
7. 管理多版本(可选)
使用 update-alternatives 管理多版本:
sudo update-alternatives --install /usr/bin/nvcc nvcc /usr/local/cuda-11.8/bin/nvcc 100
sudo update-alternatives --config nvcc
选择对应的版本编号即可切换。
8. 关键点总结
驱动版本决定支持的最高CUDA运行时(nvidia-smi显示的版本)。
工具包版本(nvcc)需通过安装并配置环境变量指定。
PyTorch基于驱动支持的CUDA运行时运行,但编译库依赖nvcc版本。
按此流程调整后,即可解决CUDA工具包版本过低的问题。