当前位置: 首页 > news >正文

CUDA从入门到放弃

1 CUDA简介

  • GPU为图形处理器, 也是显卡的“大脑”
  • 显卡集成了GPU, 显存和其他电路的硬件
  • GPU: 计算密集型
  • CPU: 逻辑流控制
  • GPU性能指标:
    • 核心数
    • GPU显存容量
    • GPU计算峰值
    • 显存带宽
  • GPU不能单独计算, CPU+GPU组成异构计算架构
  • CPU起到控制作用, 一般成为主机(Host), GPU可以看作CPU的协处理器, 一般称为设备(Device); 主机和设备之间内存访问一般通过PCle总线链接(速度不快)
  • 简言之:CUDA是英伟达写给GPU的“软件语言”, 让GPU变成超级计算机, 那么CUDA怎么工作呢?
    • 硬件基础: CUDA只在英伟达的GPU上跑
    • 软件部分: C/C++加上CUDA语法写代码
    • 并行计算: GPU有几千个小核心, 每个核心干一小块活
  • 2006年, NVIDIA(英伟达)公司发布CUDA(Compute Unified Device Architecture, 统一计算设备架构, 也就是说CUDA是NVIDIA开发的一种“超级工具”,让GPU可以做更多的事情, 比如跑复杂的计算任务, AI训练等), CUDA建立在NVIDIA的CPU上的一个通用并行计算平台和编程模型
  • CUDA旨在支持各种语言和应用编程接口,最初基于C语言,目前支持C++,python等语言(本篇笔记使用C++)
  • CUDA提供两层API接口,CUDA驱动(driver)API和CUDA运行时(runtime)API, 两种API调用性能几乎无差异
http://www.dtcms.com/a/167401.html

相关文章:

  • 小结:ipsec-ike
  • 使用 MCP(模型上下文协议)和 Claude 在 Node.js 中构建聊天应用程序
  • Learning vtkjs之DepthTest
  • 21.2Linux中的LCD驱动实验(驱动)_csdn
  • [操作系统] 线程互斥
  • 大模型 Function Call
  • Unity SpriteEditor(精灵图片编辑器)
  • 24.Linux中RTC的驱动实验_csdn
  • 1.67g 雨晨 22635.5305 Windows 11 企业版 23H2 极速增强版
  • 边缘计算革命:大模型轻量化部署全栈实战指南
  • 机器人--底盘
  • 链表系列一>合并 k 个升序链表
  • Sublime Text4 4192 安装和一键激活
  • 基于Redis实现-附近商铺查询
  • 在项目中如何对Map List等对象序列化及反序列化
  • 第二章 OpenCV篇-图像阈值的综合操作-Python
  • 【瑞萨RA4L1-SENSOR套件测评】LCD 实时显示 ADC 水位高度
  • vue中$set原理
  • AIO-1126-JD4蓝牙通讯(BLE)
  • Lucene并不是只有倒排索引一种数据结构,支持多种数据结构
  • Angular教程前言:历史、安装与用途
  • Webug4.0靶场通关笔记08- 第11关万能密码登录(SQL注入漏洞)
  • 数字智慧方案5968丨智慧农业产销一体化云平台建设方案(72页PPT)(文末有下载方式)
  • 【Docker】Dockerfile 使用
  • python如何把pdf转word
  • 高等数学-第七版-下册 选做记录 习题9-7
  • C++11新特性_自动类型推导_auto
  • 【RocketMQ】- 源码系列目录
  • 神经网络—损失函数
  • Windows服务器提权实战:常见方法、场景与防御指南