当前位置: 首页 > news >正文

GPU架构

以下为GPU的内部结构图,图片来自于1

GPU由多个GPU处理集群(GPC)构成,每个GPC由纹理处理集群(TPC)构成,每个TPC由多个流多处理(SM)构成.
GPU的最基本的处理单元位于SM中。
SM的结构如下:

英文架构图2

一个SM中可以并行多个线程。通过线程束调度器进行软件层面控制,通过分配单元将线程分配到具体的计算单元中。
计算单元分为int、FP32、FP64以及Tensor Core。
对应的功能结构如下:

详细的内容可以查看视频3

参考链接


  1. V100GPU架构 ↩︎

  2. volta-architecture-whitepaper ↩︎

  3. # GPU硬件架构与CUDA如何对应 ↩︎

相关文章:

  • 1. 视频基础知识
  • tinyrenderer笔记(上)
  • openssl 生成自签名证书实现接口支持https
  • chili3d调试笔记12 deepwiki viewport
  • kubeadm部署k8s
  • XSS ..
  • K8S有状态服务部署(MySQL、Redis、ES、RabbitMQ、Nacos、ZipKin、Sentinel)
  • K8S使用--dry-run输出资源模版和兼容性测试
  • Eigen矩阵的平移,旋转,缩放
  • 【SpringBoot教程】SpringBoot自定义注解与AOP实现切面日志
  • 深入解析二维矩阵搜索:LeetCode 74与240题的两种高效解法对比
  • C语言 指针(7)
  • 【工具变量】数字人民币试点城市DID(2007-2024年)
  • 【心海资源】0U攻击工具|一键模仿地址生成+余额归集+靓号生成系统
  • 神经网络:节点、隐藏层与非线性学习
  • Ubuntu 系统详解
  • Unable to determine the device handle for GPU0000:82:00.0: Unknown Error
  • 知乎前端面试题及参考答案
  • 用于备份的git版本管理指令
  • DC-DC降压型开关电源(Buck Converter)设计中,开关频率(f sw​ )、滤波电感(L)和滤波电容(C out​ )的关系和取舍
  • 昆廷·斯金纳:作为“独立自主”的自由
  • 吴清:基金业绩差的必须少收管理费,督促基金公司从“重规模”向“重回报”转变
  • 上海虹桥机场至北京首都机场快线试运行跨航司自愿签转服务
  • 践行自由贸易主义理念,加快区域合作进程
  • 长三角铁路今日预计发送386万人次,沪宁、沪杭等方向尚有余票
  • 首日5金!中国队夺得跳水世界杯总决赛混合团体冠军