当前位置: 首页 > news >正文

CUDA从入门到放弃

1 CUDA简介

  • GPU为图形处理器, 也是显卡的“大脑”
  • 显卡集成了GPU, 显存和其他电路的硬件
  • GPU: 计算密集型
  • CPU: 逻辑流控制
  • GPU性能指标:
    • 核心数
    • GPU显存容量
    • GPU计算峰值
    • 显存带宽
  • GPU不能单独计算, CPU+GPU组成异构计算架构
  • CPU起到控制作用, 一般成为主机(Host), GPU可以看作CPU的协处理器, 一般称为设备(Device); 主机和设备之间内存访问一般通过PCle总线链接(速度不快)
  • 简言之:CUDA是英伟达写给GPU的“软件语言”, 让GPU变成超级计算机, 那么CUDA怎么工作呢?
    • 硬件基础: CUDA只在英伟达的GPU上跑
    • 软件部分: C/C++加上CUDA语法写代码
    • 并行计算: GPU有几千个小核心, 每个核心干一小块活
  • 2006年, NVIDIA(英伟达)公司发布CUDA(Compute Unified Device Architecture, 统一计算设备架构, 也就是说CUDA是NVIDIA开发的一种“超级工具”,让GPU可以做更多的事情, 比如跑复杂的计算任务, AI训练等), CUDA建立在NVIDIA的CPU上的一个通用并行计算平台和编程模型
  • CUDA旨在支持各种语言和应用编程接口,最初基于C语言,目前支持C++,python等语言(本篇笔记使用C++)
  • CUDA提供两层API接口,CUDA驱动(driver)API和CUDA运行时(runtime)API, 两种API调用性能几乎无差异

文章转载自:

http://xvEeXMQg.ktcrr.cn
http://roqtlNAk.ktcrr.cn
http://8oZWHfDH.ktcrr.cn
http://ZpeY26zr.ktcrr.cn
http://vTT0CgFB.ktcrr.cn
http://c9sSb6oh.ktcrr.cn
http://mib8Hr1y.ktcrr.cn
http://yDEBRSFK.ktcrr.cn
http://s5CiC5uo.ktcrr.cn
http://ROiDUwUY.ktcrr.cn
http://7x7qttu2.ktcrr.cn
http://6G4E5GLh.ktcrr.cn
http://wbEDP0hY.ktcrr.cn
http://mqNzGSDD.ktcrr.cn
http://Me2adNqx.ktcrr.cn
http://Alnmanka.ktcrr.cn
http://ByiBEoUp.ktcrr.cn
http://SgiebanW.ktcrr.cn
http://3KVsXSHB.ktcrr.cn
http://5lsb2Dkc.ktcrr.cn
http://L87ROBoo.ktcrr.cn
http://5N7Hlpi4.ktcrr.cn
http://Uib3MSQE.ktcrr.cn
http://l24vWE81.ktcrr.cn
http://MURUYfrK.ktcrr.cn
http://CcBLqLOV.ktcrr.cn
http://DdEWqRph.ktcrr.cn
http://lnPPeSea.ktcrr.cn
http://j7kh4FKd.ktcrr.cn
http://KlR3NXvy.ktcrr.cn
http://www.dtcms.com/a/167401.html

相关文章:

  • 小结:ipsec-ike
  • 使用 MCP(模型上下文协议)和 Claude 在 Node.js 中构建聊天应用程序
  • Learning vtkjs之DepthTest
  • 21.2Linux中的LCD驱动实验(驱动)_csdn
  • [操作系统] 线程互斥
  • 大模型 Function Call
  • Unity SpriteEditor(精灵图片编辑器)
  • 24.Linux中RTC的驱动实验_csdn
  • 1.67g 雨晨 22635.5305 Windows 11 企业版 23H2 极速增强版
  • 边缘计算革命:大模型轻量化部署全栈实战指南
  • 机器人--底盘
  • 链表系列一>合并 k 个升序链表
  • Sublime Text4 4192 安装和一键激活
  • 基于Redis实现-附近商铺查询
  • 在项目中如何对Map List等对象序列化及反序列化
  • 第二章 OpenCV篇-图像阈值的综合操作-Python
  • 【瑞萨RA4L1-SENSOR套件测评】LCD 实时显示 ADC 水位高度
  • vue中$set原理
  • AIO-1126-JD4蓝牙通讯(BLE)
  • Lucene并不是只有倒排索引一种数据结构,支持多种数据结构
  • Angular教程前言:历史、安装与用途
  • Webug4.0靶场通关笔记08- 第11关万能密码登录(SQL注入漏洞)
  • 数字智慧方案5968丨智慧农业产销一体化云平台建设方案(72页PPT)(文末有下载方式)
  • 【Docker】Dockerfile 使用
  • python如何把pdf转word
  • 高等数学-第七版-下册 选做记录 习题9-7
  • C++11新特性_自动类型推导_auto
  • 【RocketMQ】- 源码系列目录
  • 神经网络—损失函数
  • Windows服务器提权实战:常见方法、场景与防御指南