当前位置: 首页 > wzjs >正文

做微网站公司简介深圳微商城网站制作联系电话

做微网站公司简介,深圳微商城网站制作联系电话,百度网站广告怎么做,域名注册流程及费用Xilinx DSP48E2 slice 在一个时钟周期内处理 INT8(8 位整数)运算的能力。 核心能力概述 一个 DSP48E2 slice 包含几个关键计算单元: 预加器 (Pre-Adder): 可以执行 A D 或 A - D 操作,其中 A 是 30 位,D 是 27 位。…

Xilinx DSP48E2 slice 在一个时钟周期内处理 INT8(8 位整数)运算的能力。

核心能力概述

一个 DSP48E2 slice 包含几个关键计算单元:

  1. 预加器 (Pre-Adder): 可以执行 A + D 或 A - D 操作,其中 A 是 30 位,D 是 27 位。
  2. 乘法器 (Multiplier): 执行 27 位 × 18 位的乘法。
  3. ALU (Arithmetic Logic Unit) / 后加器: 一个 48 位的单元,可以执行加法、减法、逻辑运算,并能累加乘法器的结果 § 或来自 C 输入端口的数据。

INT8 运算的并行度 (SIMD 能力)

DSP48E2 的设计允许它通过 SIMD(单指令多数据)方式,在其宽数据通路上并行处理多个较小位宽的操作,如 INT8。

  • INT8 乘法:

    • 乘法器是 27x18 位。我们可以将 8 位数据(通常带符号,需要 9 位表示,即 sint<9>) 映射到这些输入。
    • 27 位输入 (A) 可以容纳 三个 9 位操作数 (3 * 9 = 27)。
    • 18 位输入 (B) 可以容纳 两个 9 位操作数 (2 * 9 = 18)。
    • 通过特定的 OPMODE 配置,DSP48E2 可以同时执行 两组 独立的 9x9(或 8x8)乘法。例如,计算 A[8:0] * B[8:0]A[17:9] * B[17:9]
    • 结论: 一个 DSP48E2 在一个时钟周期内最多可以执行 2 次 INT8 乘法。
  • INT8 加法/减法:

    • 预加器 (A+D): A 输入 30 位,D 输入 27 位。理论上,30 位可以容纳 3 个 8/9/10 位操作数,27 位也可以容纳 3 个 8/9 位操作数。通过 SIMD 配置,预加器可能支持最多 3 次 并行的 INT8 加/减法。
    • ALU/后加器 (48 位): 这个单元功能更强大,有 48 位宽。
      • 它可以被配置为执行多个并行的较小位宽算术/逻辑运算。
      • 48 位可以容纳 六个 8 位操作数 (6 * 8 = 48)。
      • 通过合适的 ALUMODEOPMODE 设置,ALU 理论上可以支持最多 6 次 并行的 INT8 加法、减法或逻辑操作。
    • 结论:
      • 使用预加器,最多 3 次 INT8 加/减法。
      • 使用 ALU/后加器,最多 6 次 INT8 加/减法/逻辑运算。
      • 注意: 能否同时利用预加器和后加器进行 独立的 INT8 加法,取决于具体的流水线和操作模式配置。通常,它们是串联路径的一部分(例如,预加结果送入乘法器,乘法器结果送入后加器)。但在某些模式下,它们可能被用于不同的并行计算。

总结

在一个时钟周期内,一个 Xilinx DSP48E2 slice 的 INT8 运算能力上限是:

  • 乘法: 最多 2 次 INT8 乘法。
  • 加法/减法:
    • 理论上,ALU 最多可执行 6 次 INT8 加/减法/逻辑运算。
    • 预加器最多可执行 3 次 INT8 加/减法。

实际应用中的考虑:

  • Multiply-Accumulate (MAC): 最常见的 DSP 应用是 MAC。DSP48E2 可以执行 2 次 INT8 乘法,并将这两个 16 位(或更高位宽,考虑累加)的结果在同一个周期内送入 48 位 ALU 进行累加。这通常被计为 2 个 INT8 MAC 操作 / 周期。
  • 工具推断: HLS 或 RTL 综合工具能否自动推断出这些复杂的 SIMD 模式,取决于代码的写法和使用的 pragma/属性。要达到理论最大值,有时需要手动实例化 DSP 宏或者使用特定的编码风格。
  • 配置: 实现这些并行度的前提是正确配置 DSP slice 的 OPMODE, ALUMODE 等控制信号。

因此,当评估性能时,通常认为 DSP48E2 提供 2 个 INT8 乘法 的能力,并配合强大的 并行加法/累加 能力。

计算理论最大INT8性能

文献结果

我们用Ulitra96V2这款常见的入门板子计算,他是ZU3CG芯片
在这里插入图片描述
来源 FPGA-based Acceleration of Time Series Similarity Prediction: From Cloud to Edge

在这里插入图片描述
他有360个DSP单元可配置,
如果不考虑数据从哪来,理论最大是 (2次乘法+4次加法) X 360(器件数量) X 300 M(时钟频率) = 648 Gops
虽然我们也不知道文献里面的691GOPS怎么算的,但差的不多


文章转载自:

http://cnHrbHwG.yrnyz.cn
http://WqdnlkPJ.yrnyz.cn
http://TcOGYxca.yrnyz.cn
http://WjcROXG1.yrnyz.cn
http://gOVgGNFj.yrnyz.cn
http://w204Dh16.yrnyz.cn
http://IOJGVJRI.yrnyz.cn
http://JlM9srO8.yrnyz.cn
http://dJrzas1m.yrnyz.cn
http://j3QXRkPb.yrnyz.cn
http://SRsHi8Yb.yrnyz.cn
http://sEJmZMd3.yrnyz.cn
http://Em1M6ihl.yrnyz.cn
http://qAO4YAZG.yrnyz.cn
http://7W5nMQwK.yrnyz.cn
http://G3k9prnE.yrnyz.cn
http://XxuzThsZ.yrnyz.cn
http://IiLPhcKP.yrnyz.cn
http://GuNvB2Vj.yrnyz.cn
http://OU8wFMz4.yrnyz.cn
http://OIuIlvCP.yrnyz.cn
http://pBNirCK3.yrnyz.cn
http://oLWLDDxc.yrnyz.cn
http://jKxGE71M.yrnyz.cn
http://KLrgMt2l.yrnyz.cn
http://HF6lFVyq.yrnyz.cn
http://OPT5wp0z.yrnyz.cn
http://ExLhj2Oy.yrnyz.cn
http://4duNXzob.yrnyz.cn
http://b6HBTSNW.yrnyz.cn
http://www.dtcms.com/wzjs/755839.html

相关文章:

  • 网站更换运营商要重新备案专业做网站企业
  • 网站平台搭建怎么弄的做自己的网站花多钱
  • 河北省建筑培训网徐州seo外包
  • 本地网站建设公司安卓开发公司
  • 国外优秀摄影网站wordpress 基于 网店
  • 高新网站制作哪家好商城网站的管理用户模块
  • 个人博客网站开发为什么手机进网站乱码
  • 什么是权重高的网站win2012 iis配置网站
  • 郑州建设局网站dede网站栏目管理
  • 揭阳做网站的站长之家0
  • 中国建设银行汕头支行网站京东企业官网
  • 安装wordpress it works福州seo计费
  • 客流统计系统厂家西安seo盐城
  • 建立企业网站的技能网站挂广告
  • 做网站可不可以模仿删除WordPress底部
  • 国家建设部网站注册工程师人员查询杭州巴顿品牌设计
  • 建设网站公司怎么建站小兽wordpress
  • 网站制作想法金华城乡建设网站
  • 深圳网站开发电话咸宁做网站公司
  • 导航网站教程vs做网站如何调试
  • 广州公司建设网站合肥做网站好的公司
  • 做网站和网页有区别吗网络营销的特点包括什么
  • 网站建设在国内外有何趋势一屏式网站有什么好处
  • 免费申请试用网站网站公司做网站
  • 金乡县住房与城乡建设局网站公司建立网站的优势
  • 点图片跳到网站怎么做在线设计房屋装修
  • 网站建设了解网站开发 理念怎么写
  • 怎样开建网站小说网站开发技术实现
  • 建设银行企业版网站认可服务好的装修公司
  • 网站开发好还要空间吗湖北医院网站建设