当前位置: 首页 > wzjs >正文

高水平 专业 建设 网站百度招商客服电话

高水平 专业 建设 网站,百度招商客服电话,石家庄做网站推广,做购物比价的网站有哪些目录 1. 简介 2. 示例分析 2.1 代码分析 2.2 控制驱动TLP的关键特征 2.3 数据驱动TLP的关键特征 3. 总结 1. 简介 在 HLS 硬件加速领域,Vitis HLS 提供了强大的抽象并行编程模型。这些模型包括控制驱动和数据驱动的任务级并行性(TLP)&…

目录

1. 简介

2. 示例分析

2.1 代码分析

2.2 控制驱动TLP的关键特征

2.3 数据驱动TLP的关键特征

3. 总结


1. 简介

在 HLS 硬件加速领域,Vitis HLS 提供了强大的抽象并行编程模型。这些模型包括控制驱动和数据驱动的任务级并行性(TLP),它们是硬件设计优化的基石。控制驱动TLP通过#pragma HLS dataflow指令实现函数的并行执行,而数据驱动TLP则利用hls::task类将函数转化为并行任务。这篇博文将深入探讨这两种并行性的特点,并通过代码示例展示它们在实际硬件设计中的应用,揭示如何有效地结合这两种模型以提升硬件性能和加速复杂算法的执行。

2. 示例分析

2.1 代码分析

#include "hls_np_channel.h"
#include "hls_task.h"void worker(hls::stream<int>& in, hls::stream<int>& out) {int i = in.read();int o = i * 2 + 1;out.write(o);
}void read_in(int* in, int n, hls::stream<int>& out) {for (int i = 0; i < n; i++) {out.write(in[i]);}
}void write_out(hls::stream<int>& in, int* out, int n) {for (int i = 0; i < n; i++) {out[i] = in.read();}
}void dut(int in[16], int out[16], int n) {hls_thread_local hls::split::round_robin<int, 4> split1;hls_thread_local hls::merge::round_robin<int, 4> merge1;
#pragma HLS dataflowread_in(in, n, split1.in);// Task-Channelshls_thread_local hls::task t[4];for (int i = 0; i < 4; i++) {
#pragma HLS unrollt[i](worker, split1.out[i], merge1.in[i]);}write_out(merge1.out, out, n);
}

功能分析:

  • worker:从输入流中读取数据,进行处理(乘2加1),然后将结果写入输出流。
  • read_in:从输入数组中读取数据,写入到输出流。
  • write_out:从输入流中读取数据,写入到输出数组。

2.2 控制驱动TLP的关键特征

#pragma HLS dataflow 指示HLS工具启用数据流模式,让不同的函数可以并行执行,它是控制驱动TLP的关键特征,具体体现如下:

  • read_in 函数和 split1 模块将数据分发到不同的通道。
  • 四个 worker 函数并行处理数据。
  • write_out 函数和 merge1 模块从不同的通道收集数据并写入输出数组。

此外,顶层函数 void dut(int in[16], int out[16], int n)  中,参数 in 和 out 均为外部存储器。

2.3 数据驱动TLP的关键特征

hls::task是一个任务通道,它允许将函数作为任务并行执行,它是数据驱动TLP的关键特征

示例代码中,worker函数被封装成任务并分配给四个hls::task实例,每个实例处理输入数据流的一部分,并将结果发送到合并通道。

hls::split::round_robin和hls::merge::round_robin是用于数据分割和合并的工具,它们支持数据流中的并行处理。split1将输入数据流平均分配给四个工作任务,而merge1则将这些任务的输出合并回单个数据流。

#pragma HLS unroll指令用于完全展开循环,确保所有任务并行执行。

3. 总结

在Vitis HLS中,控制驱动(Control-driven)和数据驱动(Data-driven)的并行性是高效硬件设计的两个关键组成部分。控制驱动并行性通过#pragma HLS dataflow指令实现,允许不同函数在数据准备好时即刻并行执行,从而优化整体性能。数据驱动并行性则通过hls::task类实现,它将函数封装为可并行执行的任务。这两种技术的结合,使得设计者能够充分利用硬件资源,实现复杂算法的高效执行。通过示例代码的分析,我们可以看到如何在实践中应用这些并行编程模型,以及它们如何协同工作以达到最佳的硬件加速效果。

http://www.dtcms.com/wzjs/221507.html

相关文章:

  • 汽车商城网站建设线上推广费用
  • 武汉百度快速排名提升长沙关键词优化首选
  • 江门建设企业网站站长之家seo概况查询
  • 杭州建设局网站首页 柳爱链网买链接
  • 网站后台无法更新缓存seo排名优化教学
  • 郑州网站分析百度热搜关键词排行榜
  • 房产经纪人怎么做网站搜索引擎公司排名
  • 东莞做网站沃德精准推广的渠道有哪些
  • 野花免费观看日本电影哔哩哔哩seo公司厦门
  • 网站关键词优化排名软件系统国内做网站比较好的公司
  • 教育部学风建设网站怎么做网站教程
  • 寿光专业做网站的公司凡科网免费建站
  • 网站建设详细报价单百度网盘资源分享
  • 中山网站建设seo135百度投放广告平台
  • 网站用什么语言百度网站大全
  • 给别人做网站必须有icp网站seo是什么
  • 代理商加盟项目网站惠州网络推广平台
  • 网站会员管理系统seo关键词排名优化手机
  • 人才招聘网站模板html可以免费发布广告的平台有哪些
  • 房山建设网站百度关键词搜索指数
  • 佛山企业网站建设服务企业网站
  • 企业网站静态模板下载百度推广登陆平台
  • 如何处理并发量大的购物网站电脑清理软件十大排名
  • 人才招聘网官网入口seo排名技巧
  • 网站网页制作公司网站网络营销的内涵
  • 凡科网站后台百度投诉中心在线申诉
  • 怎么做软件 用手机深圳seo优化
  • 网站建设案例分析关键词都有哪些
  • 网站建设服务亿企网络针对百度关键词策划和seo的优化
  • 山东手机版建站系统哪家好正规拉新推广平台有哪些