当前位置: 首页 > news >正文

小杰深度学习(nine)——CUDA与CuDNN安装

CUDA与CuDNN安装

前言:

在深度学习中,我们常常要对图像数据进行处理和计算,而处理器CPU因为需要处理的事情多,并不能满足我们对图像处理和计算速度的要求显卡GPU就是来帮助CPU来解决这个问题的,GPU特别擅长处理图像数据,而CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎,安装cuda之后,可以加快GPU的运算和处理速度

1.什么是显卡?

显卡(Video card,Graphics card)全称显示接口卡,又称显示适配器,是计算机最基本配置、最重要的配件之一。显卡作为电脑主机里的一个重要组成部分,是电脑进行数模信号转换的设备,承担输出显示图形的任务。显卡接在电脑主板上,它将电脑的数字信号转换成模拟信号让显示器显示出来,同时显卡还是有图像处理能力可协助CPU工作提高整体的运行速度。对于从事专业图形设计的人来说显卡非常重要。民用和军用显卡图形芯片供应商主要包括AMD(超微半导体)和Nvidia(英伟达)2家。现在的top500计算机,都包含显卡计算核心。在科学计算中,显卡被称为显示加速卡。

2.什么是显存?

也被叫做帧缓存,它的作用是用来存储显卡芯片处理过或者即将提取的渲染数据。如同计算机的内存一样,显存是用来存储要处理的图形信息的部件。、

3.显卡、显卡驱动、CUDA之间的关系

显卡:(GPU),主流是NVIDIA的GPU,因为深度学习本身需要大量计算。GPU的并行计算能力,在过去几年里恰当地满足了深度学习的需求。AMD的GPU基本没有什么支持,可以不用考虑。

驱动:没有显卡驱动,就不能识别GPU硬件,不能调用其计算资源。window一般都安装上了驱动了。

CUDA:是显卡厂商NVIDIA推出的只能用于自家GPU的并行计算框架。只有安装这个框架才能够进行复杂的并行计算。主流的深度学习框架也都是基于CUDA进行GPU并行加速的,几乎无一例外。还有一个叫做cudnn,是针对深度卷积神经网络的加速库

4.显卡驱动与cuda的关系:

NVIDIA的显卡驱动器与CUDA并不是一一对应的,CUDA本质上只是一个工具包而已,所以可以在同一个设备上安装很多个不同版本的CUDA工具包,比如可以同时安装 CUDA 9.0、CUDA 9.2、CUDA 10.0三个版本。一般情况下,安装适合当前电脑的CUDA即可。

5.为什么GPU特别擅长处理图像数据呢?

这是因为图像上的每一个像素点都有被处理的需要,而且每个像素点处理的过程和方式都十分相似,GPU就是用很多简单的计算单元去完成大量的计算任务,类似于纯粹的人海战术。

6.查看自己电脑是否可以使用GPU加速?

想要使用GPU加速,则需要安装cuda,所以首先需要了解自己的电脑显卡是否支持cuda的安装,也就是查看自己的电脑里面有没有NVIDA的独立显卡,这里再说明一下,AMD的显卡不支持安装cuda来进行加速,具体查看步骤如下:

6.1第一步

开始菜单输入框输入设备管理器,打开设备管理器,找到显示适配器后点击,查看电脑显卡型号。

6.2第二步

桌面右键打开NVIDIA控制面板。

打开NVIDA控制面板,查看GPU显卡所支持的CUDA版本,具体开始菜单 -》NVIDIA控制面板-》帮助-》系统信息-》组件-》nvidia.dll后面的cuda参数,可以看到,我的显卡支持版本为12.2,所以我下载安装<=12.2版本的cuda即可

nvidia-smi显示的CUDA Version是当前驱动的最高支持版本,因为CUDA是向下兼容的,所以最高支持版本以下的CUDA版本都是支持的,如图,nvidia-smi显示最高版本支持为12.2,那12.2以及12.2以下的版本都是支持的。右键cmd命令输入nvidia-smi 如下图所示:

7.下载与安装CUDA

7.1第一步

到官网下载CUDA安装包,前面我们已经查看到了电脑GPU显卡所支持的CUDA版本为<=12.2,下载地址:https://developer.nvidia.com/cuda-toolkit-archive

需要注册账号登录进去

点击红框圈起来的版本。

选择安装程序的版本信息如下所示。

7.2 第二步:

下载完后,双击

extraction path可以不用修改,默认路径即可。cuda安装完成后,该路径下的文件就自动删除了

7.3 第三步

一切正常,检查系统兼容性。点击同意并继续

7.4 第四步:

选择自定义安装并进行下一步

7.5 第5步:

自定义组件全选直接下一步

7.6 第6步:

选择安装位置默认就行,下一步

7.7 第7步:

不用选择安装visual studio ,如下图勾选上,直接进行下一步

7.8 第8步

安装进行中等待程序完成安装 大约几分钟

7.9 第9步

完成安装进行下一步

7.10 第10步

关闭

8.查看CUDA是否安装成功

8.1第一步

配置完系统环境变量之后,我们就可以查看CUDA是否安装成功以及环境变量配置情况

查看安装版本:Win + R 打开cmd ,输入命令:nvcc --version

查看环境变量设置情况:输入命令:set cuda

8.2第二步

验证deviceQuery和bandwidthTest,在命令窗口运行测试文件,定位到 在cuda安装目录的 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\extras\demo_suite,右键选择在终端中打开,分别输入deviceQuery,bandwidthTest并运行,两个地方的Result=PASS则说明通过,反之,Rsult=Fail 则需要重新安装。

deviceQuery效果图

bandwidthTest效果图

如果以上都没问题,则说明CUDA安装成功。

9.cuDNN介绍

在CUDA安装完之后,如果想要学习深度学习中的神经网络的话,则额外下载安装cuDNN,可帮助我们加快神经网络的运算,cuDNN是一个常见的神经网络层加速库文件,能够很大程度把加载到显卡上的网络层数据进行优化计算,而CUDA就像一个很粗重的加速库,其主要依靠的是显卡。cuDNN需要在有CUDA的基础上进行,可以在CUDA基础上加速2倍以上。

CUDA和cuDNN关系

CUDA看作是一个工作台,上面配有很多工具,如锤子、螺丝刀等。cuDNN是基于CUDA的深度学习GPU加速库,有了它才能在GPU上完成深度学习的计算。它就相当于工作的工具,比如它就是个扳手。但是CUDA这个工作台买来的时候,并没有送扳手。想要在CUDA上运行深度神经网络,就要安装cuDNN,就像你想要拧个螺帽就要把扳手买回来。这样才能使GPU进行深度神经网络的工作,工作速度相较CPU快很多。

注意:cuDNN是一个SDK(软件开发工具包),是一个专门用于神经网络的加速包,它跟我们的CUDA没有一一对应的关系,即每一个版本的CUDA可能有好几个版本的cuDNN与之对应,但一般有一个最新版本的cuDNN版本与CUDA对应更好。

CuDNN支持的算法

卷积操作、相关操作的前向和后向过程

pooling的前向后向过程

softmax的前向后向过程

激活函数的前向后向过程,如(Relu、Sigmoid、Tanh )等

10.cuDNN下载与安装

CuDNN 是由 NVIDIA 开发的针对深度神经网络的加速库,基于 CUDA 平台构建,专为 GPU 优化,用于加速深度学习框架(如 TensorFlow、PyTorch、Caffe 等)中的神经网络计算。它提供了高度优化的神经网络层(如卷积、池化、归一化、循环神经网络等)的实现,显著提升深度学习任务的训练和推理速度。

第一步:

官网下载cuDNN的安装包,地址:https://developer.nvidia.com/cudnn,这里需要你注册一个账号,(如果前面注册了这边就不用注册了)按照要求注册完就可以下载安装包了,这里我的CUDA安装的是12.1版本的,我就安装与我CUDA对应的cuDNN了。

第二步:

下载好安装包后,利用解压软件解压出来。

第三步:

复制粘贴 bin、include、lib三个文件到CUDA的安装目录进行覆盖替换

cuDNN到此安装成功!

11.cuda和cuDNN结合后环境变量设置

第一步:点击电脑右键选择属性

第二步:点击高级系统设置

第三步:点击环境变量

第四步:选择系统变量的Path 然后点击编辑

第五步:添加两项环境变量点击确定,必须包含这四项

点击确定后,再接着点击确定

点击确定后,再接着点击确定

12.下载安装Pytorch-GPU-pycharm—Anaconda安装

12.1安装Anaconda

12.1.1下载Anaconda安装包

去官网https://www.anaconda.com/download下载适合自己操作系统的Anaconda安装包

(以Windows为例)

12.1.2安装Anaconda

2.1双击下载后的“Anaconda3-2023.09-0-Windows-x86_64.exe”,进行安装。点击“Next”。

2.2选择同意

2.3如下选择

2.4选择安装路径 最好选择C盘以外的路径

2.5点击“Install”,等待安装完成。

12.1.3.验证Anaconda

安装完成后,点击“win”键,会出现“Anaconda Prompt”,之后双击进入,输入几条验证命令。出现所安版本即为验证成功。

12.2.创建虚拟环境

其中包括环境名称和python版本名称(我是3.9),安装新环境。

创建虚拟环境格式 conda create-n 环境名 python=版本

创建命令 conda create -n pytorch_gpu_20 python=3.9

12.3激活当前环境

输入“conda activate pytorch_gpu_20”,激活当前环境。之后不要退出,

12.3.1官网下载gpu版本的pytorch

网址:https://pytorch.org/

选择你电脑安装的cuda版本号

命令 在最后加了镜像源下载,否则太慢,容易下载失败

pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu121

包括以下3个包:

  • torch:核心包,集成pytorch的核心功能
  • torchvision:提供给图像处理的包
  • torchaudio:提供给语言处理的包

安装完成后

正确安装后,

在pycharm中查看如下图所示,是带cu121的。

测试:

在pycharm输入如下命令显示输出结果为True

12.4.设置解释器

(1)打开Pycharm,点击“文件—设置”,添加解释器(添加本地解释器)。

(2)添加Conda环境

点击“Conda环境”——选择Conda可执行文件路径——点击“加载环境”——选择“使用现有环境”——选择刚创建的虚拟环境“pytorch_gpu_20”。

(3)点击选择应用和OK

http://www.dtcms.com/a/464758.html

相关文章:

  • 鸿蒙NEXT USB Host模式开发完全指南
  • MinerU2.5 windows 本地部署
  • UIkit中使用新版UICollectionViewCompositionalLayout进行复杂布局(二)
  • 网站建设的技术问题苏州吴江建设局招标网站
  • 河南省村镇建设处网站网站配色与布局 教材
  • Prometheus运维之路(ES监控接入)
  • OpenAMP专题(一):一文了解OpenAMP全貌
  • C++ 中 rfind 方法详解
  • SpringBoot 教程(十四) SpringBoot之集成 Redis(优化版)
  • 【Linux】线程同步与互斥(上)
  • 图观 模型编辑器
  • Win11 输入延迟与鼠标卡顿:系统化排查与优化指南
  • 【开题答辩全过程】以 爱运动健身小程序的设计与实现为例,包含答辩的问题和答案
  • Linux 内核IIO sensor驱动
  • 《Linux系统编程之入门基础》【Linux的前世今生】
  • 活动汪活动策划网站龙岗建设网站
  • Apache IoTDB 架构特性与 Prometheus+Grafana 监控体系部署实践
  • LLM时代基于unstructured解析非结构化pdf
  • uniapp tab切换及tab锚点效果(wx小程序及H5端)
  • Hadoop面试题及详细答案 110题 (71-85)-- 集群部署与运维
  • 5-1〔OSCP ◈ 研记〕❘ SQL注入攻击▸SQL注入理论基础
  • 南充市企业网站建设wordpress极客主题
  • 企业做小红书关键词搜索排名推广时,怎么找到小红书上有一定搜索量但竞争度低的蓝海词?
  • 数据仓库与数据挖掘基础知识
  • 鸿蒙:使用Rating组件实现五角星打分评价
  • 外国人可以在中国做网站吗做个网站得花多少钱
  • 双均线策略
  • 【vLLM 学习】Neuron
  • 网站做行业认证好处施工企业在施工过程中发现工程设计图纸存在差错的
  • 迅为RK3576开发板挂载Windows以及虚拟机Ubuntu测试