当前位置: 首页 > news >正文

【系统设置】安装CUDA Toolkit,提升本地大模型运行效率

目标

安装CUDA Toolkit,提升本地大模型运行效率。

背景知识

CUDA(Compute Unified Device Architecture)是由NVIDIA开发的并行计算平台和编程模型,它通过利用图形处理器 (GPU) 的处理能力,可大幅提升计算性能。
CUDA Toolkit是NVIDIA提供的一套完整的开发环境,主要用于开发CUDA应用程序,充分利用GPU的并行计算能力,加速各种计算密集型任务。

DeepSeek在运行时并不完全依赖CUDA‌。虽然DeepSeek优化了PTX而不是直接使用CUDA,但它仍然需要与CUDA相关的指令集进行计算。这意味着DeepSeek并没有完全绕开CUDA,而是通过优化PTX来提高计算效率,这在一定程度上减少了对CUDA的依赖‌(减少了依赖,不是没有依赖)。

关于背景知识,推荐另一个博主的一篇文章,看着逻辑挺清晰,我是学到了:

一篇文章理清GPU、CUDA、CUDA Toolkit、cuDNN的关系_cudnn和cuda的关系-CSDN博客

通过“任务管理器”-“性能”页签,或者下面命令,可以查看自己GPU的信息。

nvidia-smi

核对版本

在开始菜单,找到显卡驱动程序的控制面板,运行

 点击“系统信息”-“组件”:查看版本号信息:

 下载toolkit

 在官网:CUDA Toolkit Archive | NVIDIA Developer,可能会看到网站黑色cookie授权提示,可以“agree”,或者不理睬,不影响下载,找到对应的版本:

 进入下载界面,选择自己操作系统和安装的版本,选择本地安装,安装程序会全部下载到本地,软件会大一些3G,我下载感觉速度还行:

 下载之后,就正常安装就好,因为安装程序有点大,我安装目录给它换到E:盘了,过程界面仅供参考:

安装测试

打开dos窗口,输入命令,返还cuda版本信息,就是成功了

nvcc -V

运行界面:

cuda安装后,自动设置了系统的环境变量,set命令查看系统参数:

set cuda

返回信息类似下面:

python程序测试

用PyTorch测试一下。

PyTorch是一个基于Python的深度学习库,专门为深度学习任务设计,提供了丰富的API和工具,使得开发者可以使用Python编写高效的深度学习代码。

进到官网PyTorch  ,点击“get started”

根据你的系统信息,网站会给出下载命令:

在vsCode中,运行安装:

安装后,创建.py测试文件,代码如下:

import torch
import torch.nn
print("cuDNN 是否可用:", torch.backends.cudnn.is_available())  # 检查 cuDNN 可用性

 执行返还true,表示成功。

相关文章:

  • 笔记:代码随想录算法训练营day48:739. 每日温度\496.下一个更大元素 I\503.下一个更大元素II
  • Unity小框架之单例模式基类
  • 吴恩达机器学习笔记复盘(六)梯度下降算法
  • 使用OpenResty(基于Nginx和Lua)优化Web服务性能
  • 【蓝图使用】绘制mesh顶点的法线
  • 中考英语之08主谓一致
  • 奇安信全流量(天眼)面试题
  • 基于CATIA二次开发的低音炮腔体容积精准计算技术详解
  • LLMs基础学习(五)模型微调专题(上)
  • 蓝桥杯刷题周计划(第三周)
  • Java 绘制图形验证码
  • 浏览器对一个资源设置了缓存,如何清除缓存,且后续请求不命中缓存
  • docker删除容器不成功问题
  • Matlab 多输入系统极点配置
  • python+MySQL+HTML实现产品管理系统
  • 打印模板公司名称动态实现自动匹配打印
  • 基于YOLO目标检测 识别 APP页面点击跳转页面加载时间,视频拆帧统计应用场景,场景数获取时间差,前端性能测试和统计
  • ChatGPT推理模型通用模型大解析!
  • 如何管理需求
  • 从零开始的python学习(六)P81+P82+P83+P84+P85
  • 空调+零食助顶级赛马备战,上海环球马术冠军赛将焕新登场
  • 体重管理门诊来了,瘦不下来的我们有救了?|健康有方FM
  • 海口市政协党组成员、秘书长、机关党组书记汪娟被查
  • 结婚这件事,年轻人到底怎么想的?
  • 中国海油总裁:低油价短期影响利润,但也催生资产并购机会
  • 节前A股持续震荡,“五一”假期持股还是持币过节胜率更高?