当前位置: 首页 > wzjs >正文

前端网站开发工具韩国最新新闻事件

前端网站开发工具,韩国最新新闻事件,网站分享到微信缩略图,百度旗下推广平台有哪些PRT(Pending Request Table)是 GPU 中用于管理 未完成内存请求(outstanding memory requests)的一种硬件结构,旨在高效处理大规模并行线程的内存访问需求。与传统的 MSHR(Miss Status Handling Registers&a…

PRT(Pending Request Table)是 GPU 中用于管理 未完成内存请求(outstanding memory requests)的一种硬件结构,旨在高效处理大规模并行线程的内存访问需求。与传统的 MSHR(Miss Status Handling Registers)不同,PRT 的设计更适应 GPU 的 warp 级并行性,显著提升了内存子系统的吞吐量和并发能力。以下从工作原理、优势、与 MSHR 的对比等方面详细解析 PRT 技术。


1. PRT 的核心设计思想

PRT 的核心是为 每个 warp 的内存指令(如加载或存储)分配一个独立的条目,而非为每个内存请求分配资源。这一设计充分利用了 GPU 的 warp 执行模型(32 个线程以 SIMD 方式并行执行),通过合并一个 warp 内所有线程的内存请求,减少对硬件资源的占用。

  • 条目内容
    每个 PRT 条目包含以下信息:
    • 内存指令的 目标地址块(如全局内存地址)。
    • 线程掩码(标识哪些线程需要该数据)。
    • 地址偏移(记录每个线程在目标地址块内的偏移量)。
    • 未完成请求计数器(跟踪该指令关联的内存请求数量)。

2. PRT 的工作流程
  1. 内存指令执行
    当 warp 执行一条内存指令(如 LDG 加载指令)时,GPU 的 Load/Store 单元会 合并线程的访问请求。例如,若多个线程访问同一缓存行,则合并为一个内存请求。

  2. PRT 条目分配

    • 若发生缓存未命中(数据不在 L1/L2 缓存中),分配一个 PRT 条目。
    • 每个 PRT 条目对应一个 warp 的内存指令,而非单个线程或单个地址请求。
  3. 生成内存请求

    • 合并后的请求被发送到显存(DRAM)或 L2 缓存。
    • 每个请求包含:
      • 目标地址块(如 128 字节的缓存行地址)。
      • PRT 条目标识符(用于后续数据分发)。
      • 线程掩码(标记哪些线程需要该数据)。
  4. 数据返回与分发

    • 当显存返回数据时,根据 PRT 条目中的 地址偏移,将数据分发到各线程的寄存器。
    • 例如,若线程 0 需要地址块内偏移 4 字节的数据,则从返回的缓存行中提取对应位置的数据。
  5. 释放 PRT 条目

    • 当所有关联的内存请求完成,且数据分发完毕后,释放 PRT 条目。

3. PRT 的关键优势
  1. 高并发处理能力
    PRT 的未完成请求数 仅受限于每个 SM 的 PRT 条目数量,而非线程数或未合并访问数。例如,在 Kepler 架构中,每个 SM 有 44 个 PRT 条目,每个条目可处理一个 warp 的 32 个线程请求,理论最大并发请求数为:
    [
    44 , \text{条目} \times 32 , \text{线程/warp} = 1408 , \text{未完成请求}
    ]
    相比 Fermi 的 MSHR(128 请求/SM),并发能力提升 11 倍

  2. 对未合并访问的容忍性
    MSHR 在未合并访问(如随机内存访问)时,需要为每个未合并请求分配独立条目,容易导致资源耗尽。而 PRT 的条目与 warp 指令 绑定,无论线程访问是否合并,每个指令仅占用一个 PRT 条目。这使得 PRT 在 非连续内存访问场景 下表现更优。

  3. 简化硬件资源管理
    PRT 通过合并 warp 级请求,减少了对细粒度资源(如每个线程的请求跟踪)的需求,降低了硬件复杂度。


4. PRT 与 MSHR 的对比
特性MSHRPRT
设计目标跟踪每个缓存行未命中请求跟踪每个 warp 的内存指令
条目分配粒度每个缓存行一个条目每个 warp 内存指令一个条目
合并能力有限(如 8 个线程合并)天然支持整个 warp(32 线程)合并
未完成请求上限受限于条目数(如 Fermi 的 128)受限于条目数 × warp 线程数(如 1408)
适用场景连续内存访问(高合并率)任意内存访问模式(包括随机访问)

5. PRT 的实际应用与优化启示
  1. 对开发者的意义

    • Kepler 及后续架构:开发者无需过度优化内存合并,可更灵活设计内存访问模式。
    • 控制 warp 指令并发数:避免单个 SM 内过多 warp 同时发起内存指令,以防 PRT 条目耗尽。
  2. 对架构设计的启示

    • 扩展 PRT 条目数:增加 PRT 条目可进一步提升并发能力(如 NVIDIA 后续架构的改进)。
    • 结合缓存优化:PRT 与 L1/L2 缓存协同工作,需平衡缓存命中率与显存带宽利用率。

6. 论文中的实验验证

论文通过 Thread-Latency 图 验证了 PRT 的优势:

  • Kepler(Tesla K20):当每个线程发起 2-3 次内存请求时,PRT 条目饱和点对应于 44 个 warp 指令(图 9-10),而非线程数或请求数,表明其设计基于 warp 级管理。
  • 对比 Fermi:Fermi 的 MSHR 在未合并访问时快速饱和(图 3-4),而 Kepler 的 PRT 在相同场景下表现更优。

参考资料

  1. https://slideplayer.com/slide/8276701/
  2. https://www.ahmado.com/profile/lashgar/files/16acmcan.pdf

文章转载自:

http://bSqBWLRh.dsLLL.cn
http://tg2trjud.dsLLL.cn
http://RjxAhRd4.dsLLL.cn
http://9mrAI1Q1.dsLLL.cn
http://r3kWqFGb.dsLLL.cn
http://gbnttTPZ.dsLLL.cn
http://kU5LUdb3.dsLLL.cn
http://yidLBcUY.dsLLL.cn
http://qLVzLN6C.dsLLL.cn
http://OBg39F4H.dsLLL.cn
http://PYei91Pl.dsLLL.cn
http://fFglPGjk.dsLLL.cn
http://ddN7jH9W.dsLLL.cn
http://e7oUKoeI.dsLLL.cn
http://x2zvnFAX.dsLLL.cn
http://UrJsJSIy.dsLLL.cn
http://AbvBxHeZ.dsLLL.cn
http://NmbUcMqf.dsLLL.cn
http://ynTYPp1M.dsLLL.cn
http://vUcNvAtx.dsLLL.cn
http://uVNM04ji.dsLLL.cn
http://C6xm2SHx.dsLLL.cn
http://PIIr3v80.dsLLL.cn
http://xotaH1ub.dsLLL.cn
http://XycTputQ.dsLLL.cn
http://KpLtWaKY.dsLLL.cn
http://twJEiCRD.dsLLL.cn
http://gZKmYbT7.dsLLL.cn
http://YqODbyUH.dsLLL.cn
http://Gz7De5wS.dsLLL.cn
http://www.dtcms.com/wzjs/625721.html

相关文章:

  • 旅游网站建设的结论鹤壁企业网站建设
  • 北京建设工程网站国外网站ip地址
  • 网站规划与建设课设报告积分购买 wordpress
  • 淘宝毕业设计网站代做申请空间 建立网站吗
  • 建立企业网站需要什么苏州淘宝网站建设培训
  • seo网站页面优化包含网站关键字怎么做
  • 公司网站制作知乎成都专业做网站公司
  • 论文中网站数据如何做脚注可以推广的app有哪些
  • 网络科技公司组织架构网站内链优化的角度
  • 多个网站如何做301linux编辑wordpress
  • 福州网站建设设计公司甘肃网站制作公司有哪些
  • html5手机网站案例服务器维护是什么意思
  • 高清免费爱做网站树状wordpress主题
  • 自身网站的平台建设公司网站建设ihanshi
  • 沈阳cms模板建站wordpress大气自媒体
  • 网站开发公司模版建设部网站从何时可以查询工程师证
  • 新乡网站开发的公司外贸网站建设方案
  • 电子商务网站推广目的分为徐州小程序开发哪家好
  • 工作网站建设中布线费用账务处理微信网站怎么制作
  • 遵义市建设局网站微信怎么创建公众号需要多少钱
  • 温州网站建设技术托管郑中设计事务所
  • 老徐蜂了网站策划书德州王霞网站建设
  • 小米路由做网站西宁做网站的公司捌君博力请
  • 如何写好网站建设方案win7电脑做网站主机
  • 介绍家乡的网站设计策划书seo短视频永久入口运营
  • 加强网站功能建设男女生做羞羞网站
  • 库尔勒网站西安十大广告设计公司
  • 毕业设计做视频网站设计网站内部优化策略
  • 大连外贸建站没有网站怎么快速做cps
  • 湘潭网站建设搭建链接检测工具