RTX 5060ti gpu 算力需求sm-120,如何安装跑通搭建部分工程依赖
-
驱动和系统级环境准备
-
CUDA和cuDNN安装
-
Python环境与项目依赖安装
-
验证与故障排除
1.最关键的第一步:非常++++++
安装NVIDIA显卡驱动
-
推荐方法:到NVIDIA官网下载最新版驱动。
-
访问 https://www.nvidia.com/Download/index.aspx
-
选择你的显卡产品系列(例如 我的 NVIDIA GeForce RTX 5070 Ti)、操作系统等,然后搜索并下载。
-
-
适用于Linux
-
安装完成后进行验证,打开终端(Command Prompt或Terminal),输入:nvidia-smi
-
你应该看到类似上图输出,这确认了驱动已正确安装,并且系统识别到了你的GPU。请记下你的CUDA Version(例如12.8),这决定了下一步你要安装的CUDA工具包版本。
-
2.最关键的第二步:非常+++++ (很多人以为确定了CUDA Version:12.8,那么我的cudatoolkit就可以选择是<=12.8) ,这是有偏差的。我们主要看显卡是否兼容你后期安装的cudatoolkit
-
以我这个为例显卡是5070ti,初始第一次安装了cudatoolkit==12.1,cuDNN==8.3.x.x,后期在虚拟环境conda下跑实验会报错,主要原因不在pytorch
-
第二次安装了cudatoolkit==12.4,cuDNN==8.6.x.x,后期在虚拟环境conda下跑实验会报错
-
第三次安装了cudatoolkit==12.6,cuDNN==8.6.x.x,后期在虚拟环境conda下跑实验还是会报错
-
多次卸载CUDA工具包和cuDNN,各种爬数据,第四次安装了cudatoolkit==12.8,cuDNN==8.9.x.x,后期在虚拟环境conda下可正常跑实验
-
安装CUDA工具包和cuDNN;根据对应的驱动Driver Version: 570.133.20 CUDA Version: 12.8,本人选择安装 cudatoolkit==12.8, cuDNN==8.9.x.x版本。官网链接为:https://developer.nvidia.com/cuda-toolkit-archive
-
按照图上wget和sudo命令依次输入 wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda_12.8.0_570.86.10_linux.run(这是下载cudatoolkit的包)
-
sudo sh cuda_12.8.0_570.86.10_linux.run(这是安装运行)
-
-
出现这个界面就代表安装完
2.3. 修改环境变量
1)添加环境变量 终端命令gedit ~/.bashrc
在文末添加,保存后退出
export PATH=/usr/local/cuda-12.8/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
2)接着在终端输入 source ~/.bashrc (更新一下)
3) 终端输入命令nvcc -V,出现此图内容就代表装成功!
3、cuDNN安装
3.1、下载,官网https://developer.nvidia.com/rdp/cudnn-archive(进去后注册账号)
cuDNN Archive | NVIDIA Developer
3.2、终端运行你下载的cudnn的包名和测试cuDNN是否安装成功
sudo dpkg -i cudnn-local-repo-ubuntu2004-8.9.7.xxxxxxxxxxxxxx
sudo cp xxxxxxxxxxxxxxx(图上画横线的部分)
3.3、依次输入下图命令,测试cuDNN是否安装成功
So,CUDA和cuDNN安装成功!
4.在conda 虚拟环境里,根据Previous PyTorch Versions链接,找到你要安装的torch,torchvision,torchaudio版本之间要匹配
找到你要安装的工程依赖包,依次安装,输入命令,程序已跑通!