当前位置: 首页 > wzjs >正文

珠海移动网站建设公司新闻发布会稿件

珠海移动网站建设公司,新闻发布会稿件,聊城企业做网站推广,百度竞价排名案例目录 1. 简介 2. 示例分析 2.1 代码分析 2.2 控制驱动TLP的关键特征 2.3 数据驱动TLP的关键特征 3. 总结 1. 简介 在 HLS 硬件加速领域,Vitis HLS 提供了强大的抽象并行编程模型。这些模型包括控制驱动和数据驱动的任务级并行性(TLP)&…

目录

1. 简介

2. 示例分析

2.1 代码分析

2.2 控制驱动TLP的关键特征

2.3 数据驱动TLP的关键特征

3. 总结


1. 简介

在 HLS 硬件加速领域,Vitis HLS 提供了强大的抽象并行编程模型。这些模型包括控制驱动和数据驱动的任务级并行性(TLP),它们是硬件设计优化的基石。控制驱动TLP通过#pragma HLS dataflow指令实现函数的并行执行,而数据驱动TLP则利用hls::task类将函数转化为并行任务。这篇博文将深入探讨这两种并行性的特点,并通过代码示例展示它们在实际硬件设计中的应用,揭示如何有效地结合这两种模型以提升硬件性能和加速复杂算法的执行。

2. 示例分析

2.1 代码分析

#include "hls_np_channel.h"
#include "hls_task.h"void worker(hls::stream<int>& in, hls::stream<int>& out) {int i = in.read();int o = i * 2 + 1;out.write(o);
}void read_in(int* in, int n, hls::stream<int>& out) {for (int i = 0; i < n; i++) {out.write(in[i]);}
}void write_out(hls::stream<int>& in, int* out, int n) {for (int i = 0; i < n; i++) {out[i] = in.read();}
}void dut(int in[16], int out[16], int n) {hls_thread_local hls::split::round_robin<int, 4> split1;hls_thread_local hls::merge::round_robin<int, 4> merge1;
#pragma HLS dataflowread_in(in, n, split1.in);// Task-Channelshls_thread_local hls::task t[4];for (int i = 0; i < 4; i++) {
#pragma HLS unrollt[i](worker, split1.out[i], merge1.in[i]);}write_out(merge1.out, out, n);
}

功能分析:

  • worker:从输入流中读取数据,进行处理(乘2加1),然后将结果写入输出流。
  • read_in:从输入数组中读取数据,写入到输出流。
  • write_out:从输入流中读取数据,写入到输出数组。

2.2 控制驱动TLP的关键特征

#pragma HLS dataflow 指示HLS工具启用数据流模式,让不同的函数可以并行执行,它是控制驱动TLP的关键特征,具体体现如下:

  • read_in 函数和 split1 模块将数据分发到不同的通道。
  • 四个 worker 函数并行处理数据。
  • write_out 函数和 merge1 模块从不同的通道收集数据并写入输出数组。

此外,顶层函数 void dut(int in[16], int out[16], int n)  中,参数 in 和 out 均为外部存储器。

2.3 数据驱动TLP的关键特征

hls::task是一个任务通道,它允许将函数作为任务并行执行,它是数据驱动TLP的关键特征

示例代码中,worker函数被封装成任务并分配给四个hls::task实例,每个实例处理输入数据流的一部分,并将结果发送到合并通道。

hls::split::round_robin和hls::merge::round_robin是用于数据分割和合并的工具,它们支持数据流中的并行处理。split1将输入数据流平均分配给四个工作任务,而merge1则将这些任务的输出合并回单个数据流。

#pragma HLS unroll指令用于完全展开循环,确保所有任务并行执行。

3. 总结

在Vitis HLS中,控制驱动(Control-driven)和数据驱动(Data-driven)的并行性是高效硬件设计的两个关键组成部分。控制驱动并行性通过#pragma HLS dataflow指令实现,允许不同函数在数据准备好时即刻并行执行,从而优化整体性能。数据驱动并行性则通过hls::task类实现,它将函数封装为可并行执行的任务。这两种技术的结合,使得设计者能够充分利用硬件资源,实现复杂算法的高效执行。通过示例代码的分析,我们可以看到如何在实践中应用这些并行编程模型,以及它们如何协同工作以达到最佳的硬件加速效果。

http://www.dtcms.com/wzjs/303844.html

相关文章:

  • 用php做网站要用什么软件app优化排名
  • 网站建设后期维护流程seo经理招聘
  • 挖掘企业构思的途径河北seo关键词排名优化
  • 搜索栏搜索网站?热?文新浪体育最新消息
  • 企业网站的网络营销功能百度竞价托管运营
  • c2c网站建设策划书怎么申请自己的网络平台
  • 多行业品牌企业公司网站模板最大免费发布平台
  • net网站开发JD网页广告调词平台
  • 专做电子产品评测的网站网络营销的策划方案
  • 应届生出来做网站还是做报纸好品牌推广活动策划方案
  • 程序员做网站给女朋友西安百度seo推广电话
  • wordpress 闭站seo排名优化代理
  • 专业服务网站开发拓客app下载
  • 旅游网站建设的意义谷歌浏览器 安卓下载2023版
  • 东至网站制作培训中心
  • 电子商务网站建设ppt模板下载巨量引擎广告投放平台
  • 常州天宁区做网站公司百度关键词怎么设置
  • 南通网站建设外包郑州网站推广公司
  • swiper wordpress主题seo报价单
  • 杭州哪家公司可以做网站天天自学网网址
  • 一个做网站的团队需要哪些天津疫情最新消息
  • 新疆工程建设云网站网店推广的方式
  • 域名网站如何做市场推广网络舆情管控
  • 重庆网站推广罗湖区seo排名
  • 专门做地图的网站上海app定制开发公司
  • 找人做网站上线后被投诉侵权百度推广热线电话
  • 毕业设计做网站还是系统好windows优化大师是系统软件吗
  • 微网站开发微网站建设seo网站排名厂商定制
  • 群晖nas怎样做网站最好的搜索引擎
  • 广州做外贸网站公司百度云盘网官网