当前位置: 首页 > news >正文

CUDA从入门到放弃

1 CUDA简介

  • GPU为图形处理器, 也是显卡的“大脑”
  • 显卡集成了GPU, 显存和其他电路的硬件
  • GPU: 计算密集型
  • CPU: 逻辑流控制
  • GPU性能指标:
    • 核心数
    • GPU显存容量
    • GPU计算峰值
    • 显存带宽
  • GPU不能单独计算, CPU+GPU组成异构计算架构
  • CPU起到控制作用, 一般成为主机(Host), GPU可以看作CPU的协处理器, 一般称为设备(Device); 主机和设备之间内存访问一般通过PCle总线链接(速度不快)
  • 简言之:CUDA是英伟达写给GPU的“软件语言”, 让GPU变成超级计算机, 那么CUDA怎么工作呢?
    • 硬件基础: CUDA只在英伟达的GPU上跑
    • 软件部分: C/C++加上CUDA语法写代码
    • 并行计算: GPU有几千个小核心, 每个核心干一小块活
  • 2006年, NVIDIA(英伟达)公司发布CUDA(Compute Unified Device Architecture, 统一计算设备架构, 也就是说CUDA是NVIDIA开发的一种“超级工具”,让GPU可以做更多的事情, 比如跑复杂的计算任务, AI训练等), CUDA建立在NVIDIA的CPU上的一个通用并行计算平台和编程模型
  • CUDA旨在支持各种语言和应用编程接口,最初基于C语言,目前支持C++,python等语言(本篇笔记使用C++)
  • CUDA提供两层API接口,CUDA驱动(driver)API和CUDA运行时(runtime)API, 两种API调用性能几乎无差异

相关文章:

  • 小结:ipsec-ike
  • 使用 MCP(模型上下文协议)和 Claude 在 Node.js 中构建聊天应用程序
  • Learning vtkjs之DepthTest
  • 21.2Linux中的LCD驱动实验(驱动)_csdn
  • [操作系统] 线程互斥
  • 大模型 Function Call
  • Unity SpriteEditor(精灵图片编辑器)
  • 24.Linux中RTC的驱动实验_csdn
  • 1.67g 雨晨 22635.5305 Windows 11 企业版 23H2 极速增强版
  • 边缘计算革命:大模型轻量化部署全栈实战指南
  • 机器人--底盘
  • 链表系列一>合并 k 个升序链表
  • Sublime Text4 4192 安装和一键激活
  • 基于Redis实现-附近商铺查询
  • 在项目中如何对Map List等对象序列化及反序列化
  • 第二章 OpenCV篇-图像阈值的综合操作-Python
  • 【瑞萨RA4L1-SENSOR套件测评】LCD 实时显示 ADC 水位高度
  • vue中$set原理
  • AIO-1126-JD4蓝牙通讯(BLE)
  • Lucene并不是只有倒排索引一种数据结构,支持多种数据结构
  • 图忆|上海车展40年:中国人的梦中情车有哪些变化(下)
  • 净海护渔,中国海警局直属第一局开展伏季休渔普法宣传活动
  • 居委业委居民群策群力,7位一级演员来到上海一小区唱戏
  • 先去上海后赴北京,苏中城市泰州为何接连拥抱顶流“大城”?
  • 中国武术协会原主席张耀庭逝世,曾促成电影《少林寺》拍摄
  • 辽宁省委书记、省长连夜赶赴辽阳市白塔区火灾事故现场,指导善后处置工作