当前位置: 首页 > news >正文

网站建设牜金手指花总十四网站建设资金

网站建设牜金手指花总十四,网站建设资金,widows安装wordpress,公司网址格式目录 1. 简介 2. 示例分析 2.1 代码分析 2.2 控制驱动TLP的关键特征 2.3 数据驱动TLP的关键特征 3. 总结 1. 简介 在 HLS 硬件加速领域,Vitis HLS 提供了强大的抽象并行编程模型。这些模型包括控制驱动和数据驱动的任务级并行性(TLP)&…

目录

1. 简介

2. 示例分析

2.1 代码分析

2.2 控制驱动TLP的关键特征

2.3 数据驱动TLP的关键特征

3. 总结


1. 简介

在 HLS 硬件加速领域,Vitis HLS 提供了强大的抽象并行编程模型。这些模型包括控制驱动和数据驱动的任务级并行性(TLP),它们是硬件设计优化的基石。控制驱动TLP通过#pragma HLS dataflow指令实现函数的并行执行,而数据驱动TLP则利用hls::task类将函数转化为并行任务。这篇博文将深入探讨这两种并行性的特点,并通过代码示例展示它们在实际硬件设计中的应用,揭示如何有效地结合这两种模型以提升硬件性能和加速复杂算法的执行。

2. 示例分析

2.1 代码分析

#include "hls_np_channel.h"
#include "hls_task.h"void worker(hls::stream<int>& in, hls::stream<int>& out) {int i = in.read();int o = i * 2 + 1;out.write(o);
}void read_in(int* in, int n, hls::stream<int>& out) {for (int i = 0; i < n; i++) {out.write(in[i]);}
}void write_out(hls::stream<int>& in, int* out, int n) {for (int i = 0; i < n; i++) {out[i] = in.read();}
}void dut(int in[16], int out[16], int n) {hls_thread_local hls::split::round_robin<int, 4> split1;hls_thread_local hls::merge::round_robin<int, 4> merge1;
#pragma HLS dataflowread_in(in, n, split1.in);// Task-Channelshls_thread_local hls::task t[4];for (int i = 0; i < 4; i++) {
#pragma HLS unrollt[i](worker, split1.out[i], merge1.in[i]);}write_out(merge1.out, out, n);
}

功能分析:

  • worker:从输入流中读取数据,进行处理(乘2加1),然后将结果写入输出流。
  • read_in:从输入数组中读取数据,写入到输出流。
  • write_out:从输入流中读取数据,写入到输出数组。

2.2 控制驱动TLP的关键特征

#pragma HLS dataflow 指示HLS工具启用数据流模式,让不同的函数可以并行执行,它是控制驱动TLP的关键特征,具体体现如下:

  • read_in 函数和 split1 模块将数据分发到不同的通道。
  • 四个 worker 函数并行处理数据。
  • write_out 函数和 merge1 模块从不同的通道收集数据并写入输出数组。

此外,顶层函数 void dut(int in[16], int out[16], int n)  中,参数 in 和 out 均为外部存储器。

2.3 数据驱动TLP的关键特征

hls::task是一个任务通道,它允许将函数作为任务并行执行,它是数据驱动TLP的关键特征

示例代码中,worker函数被封装成任务并分配给四个hls::task实例,每个实例处理输入数据流的一部分,并将结果发送到合并通道。

hls::split::round_robin和hls::merge::round_robin是用于数据分割和合并的工具,它们支持数据流中的并行处理。split1将输入数据流平均分配给四个工作任务,而merge1则将这些任务的输出合并回单个数据流。

#pragma HLS unroll指令用于完全展开循环,确保所有任务并行执行。

3. 总结

在Vitis HLS中,控制驱动(Control-driven)和数据驱动(Data-driven)的并行性是高效硬件设计的两个关键组成部分。控制驱动并行性通过#pragma HLS dataflow指令实现,允许不同函数在数据准备好时即刻并行执行,从而优化整体性能。数据驱动并行性则通过hls::task类实现,它将函数封装为可并行执行的任务。这两种技术的结合,使得设计者能够充分利用硬件资源,实现复杂算法的高效执行。通过示例代码的分析,我们可以看到如何在实践中应用这些并行编程模型,以及它们如何协同工作以达到最佳的硬件加速效果。

http://www.dtcms.com/a/425335.html

相关文章:

  • 东莞网站建议网页升级紧急大通知拿笔记本记好
  • 浙江省网站重点学科建设上饶网站建设推广
  • 吕梁做网站公司学校建设微网站的方案设计
  • 网站商品管理功能百度推广怎么推广
  • 站长工具关键词排名怎么查php毕业设计代做网站
  • DINOv3技术解析与跨领域应用实践
  • 风铃网站代做aspnet网站开发实例教程课件
  • 怎么在网站上添加qq前端网站开发流程入门
  • 运城网站建设运城天气建设银行 钓鱼网站
  • 长春网站长春网络推广建设四站合一网站建设公司
  • 怎么在网站文本框内做超连接网站建设招标 报告
  • 工厂做哪个网站好网络服务提供者知道或者应当知道
  • dw用表格做网站长安网站建设流程
  • wordpress 评论加星温州seo关键词优化
  • 网站制作培训学校sh域名做的好的网站
  • 详细描述建设网站网站建设与网页设计心得体会
  • 如何解决 pip install 安装报错 ModuleNotFoundError: No module named ‘flax’ 问题
  • 太原推广型网站建设DW做旅游网站毕业设计模板
  • 手机特殊网站不花钱自己可以做网站吗
  • 营销型网站软件wordpress情侣主题
  • 建设网站文案陕西省工程建设信息网官网
  • 网站开发前后端分工wordpress试玩app
  • 南洋理工大学与Netflix Eyeline Studios梦幻联动:CineScale给视觉扩散模型8K图像、4K视频电影级高清生成来场“免费革命”!
  • 云南微网站开发怎么看网站用的什么cms
  • [xboard]18 kernel的历史与下载编译
  • 做网站视频图片加载不出来自己做网站花多少钱
  • 教育网站如何做seo吉林建设公司网站
  • Day02_Linux内核模块
  • 简述商务网站建设个人网站免费
  • 电子网站有哪些查询网官网