当前位置: 首页 > news >正文

gpu硬件,gpu驱动,cuda,CUDA Toolkit,cudatoolkit,cudnn,nvcc概念解析

组件角色依赖关系
GPU硬件
CUDA编程模型/平台需NVIDIA GPU和驱动
CUDA Toolkit开发工具包(含NVCC、库等)需匹配GPU驱动和CUDA版本
cuDNN深度学习加速库需CUDA Toolkit
NVCCCUDA代码编译器包含在CUDA Toolkit中
  1. GPU硬件:
  • 硬件层面的图形处理器,最初用于图形渲染,后因其并行计算能力被广泛用于通用计算
  • 如Tesla、A100、RTX系列
  1. CUDA:
  • 由NVIDIA推出的并行计算平台和编程模型,透过这个技术,用户可利用GPU进行图像处理之外的运算,即允许开发者利用GPU进行通用计算。
  • 通过nvidia-smi可查看驱动支持的CUDA版本上限
  1. CUDA Toolkit(官方完整工具包)
  • CUDA 开发包,包含所有CUDA开发所需的工具和库。
    • nvcc编译器:用于编译CUDA代码(.cu文件)。
    • CUDA运行时库(如libcudart.so):提供GPU内存管理、核函数启动等API。
    • 数学加速库:如cuBLAS(线性代数)、cuFFT(傅里叶变换)等。
    • 调试工具nsightcuda-gdb等。
  • CUDA Toolkit需要GPU驱动才能调用GPU的计算能力
  • 安装方式:从NVIDIA官网下载安装包(.run.deb.msi等)
  • 安装目录:系统目录,如/usr/local/cuda-11.8
  1. cudatoolkit(第三方精简版)
  • 由第三方(如conda、PyTorch/TensorFlow团队)分发的CUDA运行时精简包,仅包含运行预编译程序所需的最小依赖。
    • CUDA运行时库(无nvcc)。
    • 部分核心库(如cuBLAScuDNN的接口头文件)。
    • 不包含:编译器、调试工具、文档等。
  • 安装方式:通过conda或pip安装conda install -c nvidia cudatoolkit=11.8
  • 安装目录:Conda环境目录
  • conda安装的cudatoolkit是精简版,不包含nvcc编译器。若需nvcc,需额外安装conda install -c nvidia cuda-nvcc=11.8 # 单独安装nvcc

为什么PyTorch推荐用cudatoolkit而不是完整CUDA Toolkit?

  • 深度学习框架已预编译好,只需CUDA运行时库,无需开发工具。
  • cudatoolkit通过conda安装更轻量,且避免污染系统环境。

cudatoolkit和完整CUDA Toolkit能共存吗?

  • 可以:conda环境的cudatoolkit与系统CUDA Toolkit互不干扰。
  1. cuDNN
  • 针对深度学习优化的加速库,提供高效实现(如卷积、池化、LSTM)

  • 每个cuDNN版本需匹配特定的CUDA Toolkit版本

  1. NVCC
  • CUDA Toolkit中的编译器,用于编译混合主机(CPU)和设备(GPU)代码。
  • nvcc --version显示的是当前安装的CUDA Toolkit版本
  1. GPU驱动(NVIDIA Driver)
  • GPU驱动是操作系统与物理GPU硬件通信的软件层,由NVIDIA提供
  • 驱动版本决定了支持的最高CUDA版本
  • 通过nvidia-smi命令查看驱动版本,如下图我的驱动版本是Driver Version: 546.30。支持的cuda最高版本为12.3。GPU硬件为RTX 3050。(GPU硬件!=GPU驱动)
  • 在这里插入图片描述

相关文章:

  • 操作系统 第2章节 进程,线程和作业
  • 【PhysUnits】3.3 SI 基础量纲单位(units/base.rs)
  • Leetcode刷题 由浅入深之字符串——541. 反转字符串Ⅱ
  • 振动临近失效状态,怎么频谱会是梳子?
  • API请求参数有哪些?
  • Modbus RTU 详解 + FreeMODBUS移植(附项目源码)
  • 【算法】:滑动窗口
  • 常见图像融合算法(alpha和金字塔融合)
  • 使用智能表格做FMEDA
  • Mysql--基础知识点--91.1--慢查询日志
  • 日常知识点之随手问题整理(思考单播,组播,广播哪个更省带宽)
  • RocketMQ 深度解析:架构设计与最佳实践
  • 学习黑客认识数字取证与事件响应(DFIR)
  • 修改docker为国内源
  • 【笔记】BCEWithLogitsLoss
  • NVME / DoCA 是什么?
  • 2025年 全新 AI 编程工具 Cursor 安装使用教程
  • 【RAG官方大神笔记】检索增强生成 (RAG):Python AI 教程的详细介绍
  • FastChat部署大模型
  • tauri-plugin-store 这个插件将数据存在本地电脑哪个位置
  • 聆听百年唐调正声:唐文治王蘧常吟诵传习的背后
  • 国家主席习近平在莫斯科出席红场阅兵式
  • 经济日报:降准降息,提前还房贷划算吗?
  • 视频丨习近平主席专机抵达莫斯科,俄战机升空护航
  • 中科院院士魏辅文已卸任江西农业大学校长
  • 特色茶酒、非遗挂面……六安皋品入沪赴“五五购物节”