当前位置: 首页 > news >正文

GPU架构

以下为GPU的内部结构图,图片来自于1

GPU由多个GPU处理集群(GPC)构成,每个GPC由纹理处理集群(TPC)构成,每个TPC由多个流多处理(SM)构成.
GPU的最基本的处理单元位于SM中。
SM的结构如下:

英文架构图2

一个SM中可以并行多个线程。通过线程束调度器进行软件层面控制,通过分配单元将线程分配到具体的计算单元中。
计算单元分为int、FP32、FP64以及Tensor Core。
对应的功能结构如下:

详细的内容可以查看视频3

参考链接


  1. V100GPU架构 ↩︎

  2. volta-architecture-whitepaper ↩︎

  3. # GPU硬件架构与CUDA如何对应 ↩︎

http://www.dtcms.com/a/174041.html

相关文章:

  • 1. 视频基础知识
  • tinyrenderer笔记(上)
  • openssl 生成自签名证书实现接口支持https
  • chili3d调试笔记12 deepwiki viewport
  • kubeadm部署k8s
  • XSS ..
  • K8S有状态服务部署(MySQL、Redis、ES、RabbitMQ、Nacos、ZipKin、Sentinel)
  • K8S使用--dry-run输出资源模版和兼容性测试
  • Eigen矩阵的平移,旋转,缩放
  • 【SpringBoot教程】SpringBoot自定义注解与AOP实现切面日志
  • 深入解析二维矩阵搜索:LeetCode 74与240题的两种高效解法对比
  • C语言 指针(7)
  • 【工具变量】数字人民币试点城市DID(2007-2024年)
  • 【心海资源】0U攻击工具|一键模仿地址生成+余额归集+靓号生成系统
  • 神经网络:节点、隐藏层与非线性学习
  • Ubuntu 系统详解
  • Unable to determine the device handle for GPU0000:82:00.0: Unknown Error
  • 知乎前端面试题及参考答案
  • 用于备份的git版本管理指令
  • DC-DC降压型开关电源(Buck Converter)设计中,开关频率(f sw​ )、滤波电感(L)和滤波电容(C out​ )的关系和取舍
  • JDBC实现--保姆级教程~
  • 【东枫科技】代理英伟达产品:智能网卡
  • 【东枫科技】代理英伟达产品:交换机系统
  • Mysql group by 用法
  • 安装篇--CentOS 7 虚拟机安装
  • C++学习之路,从0到精通的征途:stack_queue的模拟实现及deque原理介绍
  • 安卓基础(拖拽)
  • 信奥赛CSP-J复赛集训(DP专题)(37):P4170 [CQOI2007] 涂色
  • RabbitMQ ①-MQ | Linux安装RabbitMQ | 快速上手
  • 解锁健康生活:全新养身指南