当前位置: 首页 > news >正文

【系统设置】安装CUDA Toolkit,提升本地大模型运行效率

目标

安装CUDA Toolkit,提升本地大模型运行效率。

背景知识

CUDA(Compute Unified Device Architecture)是由NVIDIA开发的并行计算平台和编程模型,它通过利用图形处理器 (GPU) 的处理能力,可大幅提升计算性能。
CUDA Toolkit是NVIDIA提供的一套完整的开发环境,主要用于开发CUDA应用程序,充分利用GPU的并行计算能力,加速各种计算密集型任务。

DeepSeek在运行时并不完全依赖CUDA‌。虽然DeepSeek优化了PTX而不是直接使用CUDA,但它仍然需要与CUDA相关的指令集进行计算。这意味着DeepSeek并没有完全绕开CUDA,而是通过优化PTX来提高计算效率,这在一定程度上减少了对CUDA的依赖‌(减少了依赖,不是没有依赖)。

关于背景知识,推荐另一个博主的一篇文章,看着逻辑挺清晰,我是学到了:

一篇文章理清GPU、CUDA、CUDA Toolkit、cuDNN的关系_cudnn和cuda的关系-CSDN博客

通过“任务管理器”-“性能”页签,或者下面命令,可以查看自己GPU的信息。

nvidia-smi

核对版本

在开始菜单,找到显卡驱动程序的控制面板,运行

 点击“系统信息”-“组件”:查看版本号信息:

 下载toolkit

 在官网:CUDA Toolkit Archive | NVIDIA Developer,可能会看到网站黑色cookie授权提示,可以“agree”,或者不理睬,不影响下载,找到对应的版本:

 进入下载界面,选择自己操作系统和安装的版本,选择本地安装,安装程序会全部下载到本地,软件会大一些3G,我下载感觉速度还行:

 下载之后,就正常安装就好,因为安装程序有点大,我安装目录给它换到E:盘了,过程界面仅供参考:

安装测试

打开dos窗口,输入命令,返还cuda版本信息,就是成功了

nvcc -V

运行界面:

cuda安装后,自动设置了系统的环境变量,set命令查看系统参数:

set cuda

返回信息类似下面:

python程序测试

用PyTorch测试一下。

PyTorch是一个基于Python的深度学习库,专门为深度学习任务设计,提供了丰富的API和工具,使得开发者可以使用Python编写高效的深度学习代码。

进到官网PyTorch  ,点击“get started”

根据你的系统信息,网站会给出下载命令:

在vsCode中,运行安装:

安装后,创建.py测试文件,代码如下:

import torch
import torch.nn
print("cuDNN 是否可用:", torch.backends.cudnn.is_available())  # 检查 cuDNN 可用性

 执行返还true,表示成功。

http://www.dtcms.com/a/71970.html

相关文章:

  • 笔记:代码随想录算法训练营day48:739. 每日温度\496.下一个更大元素 I\503.下一个更大元素II
  • Unity小框架之单例模式基类
  • 吴恩达机器学习笔记复盘(六)梯度下降算法
  • 使用OpenResty(基于Nginx和Lua)优化Web服务性能
  • 【蓝图使用】绘制mesh顶点的法线
  • 中考英语之08主谓一致
  • 奇安信全流量(天眼)面试题
  • 基于CATIA二次开发的低音炮腔体容积精准计算技术详解
  • LLMs基础学习(五)模型微调专题(上)
  • 蓝桥杯刷题周计划(第三周)
  • Java 绘制图形验证码
  • 浏览器对一个资源设置了缓存,如何清除缓存,且后续请求不命中缓存
  • docker删除容器不成功问题
  • Matlab 多输入系统极点配置
  • python+MySQL+HTML实现产品管理系统
  • 打印模板公司名称动态实现自动匹配打印
  • 基于YOLO目标检测 识别 APP页面点击跳转页面加载时间,视频拆帧统计应用场景,场景数获取时间差,前端性能测试和统计
  • ChatGPT推理模型通用模型大解析!
  • 如何管理需求
  • 从零开始的python学习(六)P81+P82+P83+P84+P85
  • Vitis HLS中的hls::vector详解 矢量数据类型 单指令流多数据流 (SIMD)
  • python2和python3的区别
  • 基于SpringBoot+Vue+uniapp的高校招聘小程序+LW参考示例
  • 二叉树的层序遍历
  • Implementing SAP BPC Embedded - 2nd Edition
  • 【unity】GPU顶点动画
  • 【推理】大模型ReasonGraph:推理路径的可视化论文及代码分析
  • 神聖的綫性代數速成例題3. 矩陣列數的極限、矩陣範數、行列式的計算
  • 【Agent】OpenManus 项目架构分析
  • LLMs之CoD:《Chain of Draft: Thinking Faster by Writing Less》翻译与解读