当前位置: 首页 > news >正文

windows CUDA与CUDNN安装教程

目录

1.CUDA安装

1.1.CUDA作用

1.2.CUDA下载

1.3.CUDA安装

1.4.验证

2.CUDNN安装

2.1.CUDNN作用

 2.2.下载

 2.3.安装

 2.4.验证


1.CUDA安装

1.1.CUDA作用

       CUDA 是 NVIDIA 提供的并行计算平台和编程模型,允许开发者直接利用 GPU 的并行计算能力,而无需编写底层图形API(如OpenGL)。通过扩展 C/C++/Python 等语言,CUDA 使得开发者可以编写直接在 GPU 上运行的代码(称为核函数),适用于任何需要大规模并行计算的任务,如科学模拟、图像处理、深度学习等。

1.2.CUDA下载

使用cmd:

nvidia-smi

显示如下: 

 CUDA version12.2表示当前驱动最多支持到 CUDA Toolkit 12.2,但通常也向下兼容更低的 CUDA Toolkit 版本。

NVIDIA 驱动通常支持 所有 ≤ 驱动标称版本 的 CUDA Toolkit。例如:

  • 驱动版本 12.4 → 支持 CUDA Toolkit 12.x、11.x、10.x 等。

  • 但具体兼容范围需参考 NVIDIA 官方文档。

为了omega-ai项目更好的兼容性,我们这里安装CUDA 11.7版本,地址:CUDA Toolkit 11.7 Downloads | NVIDIA Developer

1.3.CUDA安装

执行exe按照图形界面一步步安装即可。

1.4.验证

nvcc --version  # 查看 CUDA 编译器版本

如下说明安装成功: 

2.CUDNN安装

2.1.CUDNN作用

     cuDNN 是 NVIDIA 针对深度学习优化的高性能库,基于 CUDA 构建,提供了高度优化的常见深度学习操作实现。针对卷积(Convolution)、池化(Pooling)、归一化(BatchNorm)、激活函数(ReLU等)、循环神经网络(RNN/LSTM)等操作进行了极致优化,显著提升训练和推理速度。主流深度学习框架(如 TensorFlow、PyTorch)依赖 cuDNN 作为底层计算引擎。

 2.2.下载

下载最新的11.7 cuDNN,地址:

https://developer.download.nvidia.cn/compute/cudnn/redist/cudnn/windows-x86_64/https://developer.download.nvidia.cn/compute/cudnn/redist/cudnn/windows-x86_64/

 2.3.安装

1.解压下载的 .zip 文件(如 cudnn-windows-x86_64-8.x.x.x_cuda12.x.zip)。

2.将解压后的文件夹中的内容复制到 CUDA 安装目录:

  • 复制 bin\* 到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.x\bin
  • 复制 include\* 到 CUDA\v12.x\include
  • 复制 lib\x64\* 到 CUDA\v12.x\lib\x64

至此安装完毕。 

 2.4.验证

        进入 CUDA 的安装目录(默认路径如C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\),分别进入include和lib文件夹,查看是否存在以cudnn开头的文件,如cudnn.h和cudnn.lib等。也可以运行 CUDA 安装目录下extra\demo_suite文件夹中的deviceQuery.exe和bandwidthTest.exe文件 ,在命令行中进入该文件夹目录,然后依次执行以下命令:

.\deviceQuery.exe
.\bandwidthTest.exe

 若两个程序的输出结果中都出现Result = PASS,则说明 cuDNN 安装和配置正确。

相关文章:

  • 判断两台设备是否在同一局域网内的具体方法
  • MyBatis快速入门——实操
  • 基于VSCode + PlatformIO平台的ESP8266的DS1302实时时钟
  • 【安装配置教程】ubuntu安装配置Kodbox
  • POSIX信号量
  • Kubernetes生产实战(二十七):精准追踪Pod数据存储位置
  • I2C通讯
  • springboot3+vue3融合项目实战-大事件文章管理系统-参数校验优化
  • 【RAG】11种Chunking Strategies分块策略介绍和选择
  • 工具篇-扣子空间MCP,一键做游戏,一键成曲
  • C语言中#include引用头文件的尖括号和双引号的区别
  • 【音视频工具】ffplay介绍
  • 线程的一些事(2)
  • 动态路由实现原理及前端控制与后端控制的核心差异
  • ‌中继器:网络中的“血包”与“加时器”‌
  • Ollama部署使用以及模型微调和本地部署
  • C++ stl中的set、multiset、map、multimap的相关函数用法
  • 计算机的三个根本性基础
  • Maven 公司内部私服中央仓库搭建 局域网仓库 资源共享 依赖包构建共享
  • 最长字符串 / STL+BFS
  • 京东CEO许冉:外卖日单量接近2000万单,看到外卖对平台拉动和转化效应
  • 在对国宝的探索中,让美育浸润小学校园与家庭
  • 习近平圆满结束对俄罗斯国事访问并出席纪念苏联伟大卫国战争胜利80周年庆典
  • 名帅大挪移提前开启,意属皇马的阿隆索会是齐达内第二吗
  • 上海发布首份直播电商行业自律公约,禁止虚假宣传、商业诋毁
  • 理财经理泄露客户信息案进展:湖南省检受理申诉,证监会交由地方监管局办理