Linux服务器配置深度学习环境(Pytorch+Anaconda极简版)
前言:
最近做横向需要使用实验室服务器跑模型,之前用师兄的账号登录服务器跑yolo,3张3090一轮14秒,我本地一张4080laptop要40秒,效率还是快很多,(这么算一张4080桌面版居然算力能比肩3090,老黄好刀法),不过一直用师兄的号也不好意思,所以开了自己单独的号记录下如何配置Linux深度学习的环境。
本文使用的是Anaconda进行配置,因为使用 Anaconda 安装深度学习环境时,通常不需要单独安装 CUDA 和 cuDNN,当然前提是你通过 conda install
直接安装 PyTorch 的 CUDA 版本。
前置工具:
先下好下面两个工具Xshell和Xftp到自己电脑上,前者负责远程连接,输入指令,后者负责文件传输,以及提供可视化文件管理。链接如下(注意下载免费版本的):
XSHELL - The Industry's Most Powerful SSH Clienthttps://www.netsarang.com/en/xshell/
下载后打开,两者使用方式差不多,新建会话->输入主机ip->输入用户名密码
然后点击连接就能进入远控的界面。
XFTP同理连接后能够看到下面界面,左边为本机文件管理,右边为远程主机文件管理,左键单击或右键选择传输可实现两机文件交换,同时也可可视化操作linux的文件比如复制粘贴删除重命名而不用输指令。
一、Python版本检查
(虽然理论上感觉安装anaconda前不需要额外安装python,毕竟它本身其实就是为了完成python环境的隔离,但似乎后续conda install失败时使用pip install要是版本不对可能会发生问题?以及我确实找到了一些关于anaconda和python版本的对应关系图,姑且就安装对应的版本。)
python3或python查看本地python版本,显示为3.10.6,exit()退出
二、Anaconda下载和安装
这是找到的对应图,不过也是陈年老博客了,链接如下:
Index of /archivehttps://repo.anaconda.com/archive/
依次输入下面指令:
下载:换成自己对应的链接
wget https://repo.anaconda.com/archive/Anaconda3-2023.03-1-Linux-x86_64.sh
添加权限:
chmod +x Anaconda3-2023.03-1-Linux-x86_64.sh
运行:
./Anaconda3-2023.03-1-Linux-x86_64.sh
按enter:
输入yes:
使用默认地址就好,按enter:
使用初始化,输入yes:
等待后输入ls能够看见创建了一个anaconda3的文件夹,使用rm删除之前下载的sh脚本
重新加载环境
source ~/.bashrc
查看版本校验是否安装成功
conda --version
创建一个环境,这里命名为yolo,使用3.9版本的python(师兄建议不要使用3.10+版本)
激活对应环境:
source activate yolo
三、安装torch
点击下面链接,
https://pytorch.org/get-started/previous-versions/https://pytorch.org/get-started/previous-versions/
复制下面指令:
conda install pytorch==2.4.1 torchvision==0.19.1 torchaudio==2.4.1 pytorch-cuda=11.8 -c pytorch -c nvidia
然后等待一段时间都显示done后就配置好环境了。
(是的就这么几步,倒腾了一下午就弄好了,windows的环境配置我反而折腾了一个多星期)
四、验证
1.看所有安装的库:
conda list
(前面括号里面表示激活的环境,使用source activate切换)
很明显这边以及安装上cuda版本的torch
2.代码验证:
依次输入
python
import torch
print(torch.cuda.is_available())
结果为true即可。
最后:
难得这部分配置环境顺顺利利没有出错,不过后面yolo在linux上的环境还是报了不少错,好在最后顺利解决,后续会出一篇使用yolo在windows和linux分别训练自己的模型的博客,可以点点关注!