【2025】深度学习环境搭建记录
前言
之前我写过一个关于配置环境的博客,但是那都是好几年前了,今天刚好需要配置一台服务器,过程中遇到了一些问题,所以又在网上搜了些新的博客,都很有帮助。本来我没打算写的,但是装完以后还是想着记录一下。(想到了许多年前自己写博客的初心,有些感慨。如果我们都想着去网上搜索答案,那么谁来提供答案呢?)
我这是一台新电脑
所以从安装系统开始
安装系统
我装的是ubuntu22.04 安装教程的话,网上随便搜一个即可,制作u盘我用的是Rufus,挺方便的。
u盘做好了开始安装就遇到第一个问题:
从U盘启动的时候进不去,开机出现选择,选择’try or install ubuntu’之后,直接黑屏
搜到了这个解决办法,实测可行:https://blog.csdn.net/xiangyong58/article/details/136078354
方法:
安装时,先选择" try or install ubuntu", 此时不要按enter,按"e"进入编辑模式;
进入命令行模式, 找到 quiet splash,用nomodeset替换“- - -”,然后按F10启动系统,就可以进入桌面了。
后面就正常安装就行。
显卡驱动
安装完了之后,又遇到一个问题。
开机就卡在 /dev/nvme0n1p2: clean, xxxxx/xxxxxxx files, xxxxxx/xxxxxxxxx blocks,一直进入不了图形界面
搜索到了这个博客,实测可行:https://zhuanlan.zhihu.com/p/660313153
解决办法:
这是因为新机器,没有显卡驱动的原因
1、重启电脑,按shift键进入grub,进入到grub以后,选中第一个ubuntu 选项,(不要按enter)按e键(进入edit操作)
这里面倒数第二行有一个命令如下所示
ro quiet splash $vt_handoff
将其修改为如下
rw quiet splash nomodeset $vt_handoff
然后按F10或者ctrl+x重启,就可以进入Ubuntu系统界面了。
进去之后开始安装显卡驱动
2、禁用Ubuntu自带的显卡驱动 nouveau
sudo vim /etc/modprobe.d/blacklist.conf
在文件最后部分插入以下两行内容
blacklist nouveau
options nouveau modeset=0
更新系统
sudo update-initramfs -u
重启系统(一定要重启)
reboot
验证nouveau是否已禁用
lsmod | grep nouveau
没有信息显示,说明nouveau已被禁用,接下来可以安装nvidia的显卡驱动
3、下载驱动
输入自己的显卡型号 查看显卡型号命令lspci | grep -i nvidia找到适合自己的显卡驱动
lspci | grep -i nvidia
这个查出来不是我们常见的3090 4090啥的 这个是十六进制表示,需要转换一下,具体这个命令怎么看显卡型号,可以去百度一下
根据自己的型号去官网下载显卡驱动
https://www.nvidia.cn/content/DriverDownloads/confirmation.php?url=/XFree86/Linux-x86_64/470.63.01/NVIDIA-Linux-x86_64-470.63.01.run&lang=cn&type=TITAN
4、换源以及安装软件
换源这个看个人吧,想换就换,不想换也可以,能下载软件就行
我是习惯换源
网上随便搜个教程参考下
换完了之后,在安装显卡驱动之前得先安装gcc
sudo apt install -y build-essential cmake
我还安装了vim,没有vim很不方便
5、安装驱动
给显卡驱动文件赋予可执行权限:
sudo chmod a+x NVIDIA-Linux-x86_64-470.63.01.run
如果你遇到报错信息“An error occurred while performing the step: “Building kernel modules”
那么有可能是gcc版本不匹配
可以参考这个博客:https://blog.csdn.net/weixin_43446161/article/details/138502227
解决办法:安装更新的gcc
sudo apt install gcc-12
gcc -v 查看gcc版本,如果安装后还是11,没变,那要切换一下,参考这个:https://blog.csdn.net/u010584870/article/details/133846931
并且更换gcc版本(原来是11,安装新的是12
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 100
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 90sudo update-alternatives --config gcc
安装驱动
// 只有禁用opengl这样安装才不会出现循环登陆的问题
sudo ./NVIDIA-Linux-x86_64-396.18.run -no-x-check -no-nouveau-check -no-opengl-files
ps:
-no-x-check:安装驱动时关闭X服务-no-nouveau-check:安装驱动时禁用nouveau-no-opengl-files:只安装驱动文件,不安装OpenGL文件
挂载Nvidia驱动:
modprobe nvidia
查看是否挂载成功
nvidia-smi
出现这个熟悉的画面就是成功了
环境搭建
下载anaconda 这个去官网下载,不用登陆,点跳过即可
这个随便搜个教程吧,这个没什么坑
https://blog.csdn.net/weixin_51612528/article/details/143812587