当前位置: 首页 > news >正文

GPU微架构

GPU微架构

第一章 GPU架构设计的目标


文章目录

  • GPU微架构
  • GPU与多线程
    • GPU采用多线程架构的原因
    • GPU采用多线程架构的方法
  • GPU的多线程前端拓展


GPU与多线程

GPU与CPU架构的典型特征在于并行计算,以及计算控制方法

GPU采用多线程架构的原因

  • 处理需求具有一致性(最典型的属于渲染管线:典型的渲染过程包括)
  • 针对AI计算便于多粒度组合计算(一方面支持多Batch;另一方面支持变化规模,例如feature size的变化或者MatMul的矩阵规模变化)

GPU采用多线程架构的方法

理论上,当前处理器均采用多级流水线的方法,每条指令依次通过各阶段的处理(F、D、S、E、W)。然而在顺序处理器中,如果指令数据缓存未命中,那么后续指令必须等待。而实际上存在大量情况下后续指令并不依赖当前指令。此次引入两种处理策略

  • 在多线程方法中,处理器简单切换到另一个线程,不管前一条指令是否产生阻塞。GPU采用多线程技术,灵活切换线程执行指令
  • CPU采用乱序、缓存系统和指令级并行(ILP)来应对延迟
    [备注] 更长的内存延迟一般需要更懂数量的线程来隐藏

GPU的多线程前端拓展

GPU通过程序计数器(PC)值来标记每个线程束。除了PC,每个线程束一般还需要独立的寄存器。所以,GPU中的上下文切换意味着在多个PC寄存器和寄存器文件之间的指针切换,而CPU的上下文切换一般需要把调用线程的内容重新加载寄存器文件之中,继而产生显著的时间开销
[备注] 典型的,K个线程束,每个线程具有N个寄存器,那么总寄存器文件大小为K×NK \times NK×N

http://www.dtcms.com/a/477403.html

相关文章:

  • Vue-- Axios 交互(二)
  • 中煤浙江基础建设有限公司网站曹妃甸网站建设
  • phpcms做汽车网站wordpress如何关注博客
  • 读《华为基本法》,聚焦可复用的方法论
  • CAD多面体密堆积_圆柱体试件3D V1.1版本更新
  • JavaScript变量完全指南:从基础定义到高级用法
  • 什么是VR?什么是AR?
  • NineData云原生智能数据管理平台新功能发布|2025年9月版
  • 基于AR技术交互式设备维修的技术方案剖析|阿法龙XR云平台
  • 利用 Meshery 提升云原生管理效率
  • [3dmax自研插件]——3ds Max 智能材质检查器
  • 5G+AR:开启航空维修的智能新时代
  • 长春火车站人工电话企业做响应式网站好吗
  • 竹子林附近网站建设移动互联网技术
  • 基于物联网的体温心率监测系统设计(论文+源码)
  • 股指10月想法
  • 融资业务类型、AMS 的通用支持能力、各业务在 AMS 中的流程实现
  • 波音引领航空维修变革:AR技术重塑行业未来
  • 零基础快速上手Playwright自动化测试
  • ArcGIS Pro 修改单个波段的值并组合输出新的影像数据
  • Vue 脚手架(Vue CLI)
  • 自己建设网站需要花多少钱爱南宁app下载官网最新
  • 蓝牙物联网多个核心应用场景开发与应用细化分析
  • 百度装修网站郑州建设局官网
  • 服务器在线安装插件失败/离线安装VSIX
  • 大连制作网站软件厦门网站建设外贸
  • python高级04——网络编程
  • 如何选30G、60G、100G的香港高防服务器?
  • Linux IP 网络配置与管理详解
  • Prometheus监控物理服务器