当前位置：首页 > news >正文

基于 ZYNQ MPSOC 异构平台的道路交通目标检测设计，也支持RK3588+FPGA

news 2025/11/9 11:40:52

０

引言

近年来，我国的汽车产业不断升级发展

，新能源电动汽车的销量比重不断增加

，汽车逐渐向

科技化、智能化发展

。智能汽车上的自动驾驶技

术以及行车的安全检测都离不开目标检测技术，传

统的目标检测通过人工设计并手动提取特征，检测

精度不高。随着深度学习技术以及卷积神经网络的

崛起

，深度学习算法已经取代传统算法，成为当

前目标检测任务的主流算法

常规的深度学习算法通常部署在高性能的计算

机中，计算机体积大、功耗高，不便于安装在汽车内。

将目标检测算法部署到嵌入式边缘设备上能够有效

解决上述问题，边缘设备的功耗较低、体积较小可以

灵活地进行安装部署

。当前的深度学习边缘部

署主要使用

ＡＳＩＣ平台

，但

ＡＳＩＣ

是一种定制化平

台，通常只针对单一模型，且从设计、验证到流片阶段

需要消耗大量时间和资金，设计完成后也难以进行更

改，面对快速发展的神经网络模型很难保证能够及时

适应。而ＦＰＧＡ

凭借其硬件结构具备的可重构性

和低功耗特点

，可以灵活地进行设计和修改，能够

更好地适应网络模型的升级、调整、部署。

针对

ＦＰＧＡ

神经网络模型部署问题，陈辰等

设计了基于ＦＰＧＡ

的单指令流多数据流卷积神经网

络加速器架构，通过高层次综合方法部署

ＹＯＬＯｖ２

网络，对加速器的性能和资源耗费进行深入分析和

建模，但高层次综合生成的代码可读性差，很难进一

步优化。陈浩敏等提出了基于

ＹＯＬＯｖ３-ｔｉｎｙ

的网络模型加速器，通过轻量化网络模型，满足了嵌入

式领域的部署要求，然而轻量化后网络的精度较低。

武世雄等

提出了一种基于参数量化的卷积神经

网络加速器，该加速器对参数进行了

８ｂｉｔ

定点量化

和重新排序，有效减少了内存占用和访存次数，提高

了带宽的利用率，同时该研究采用滑动窗口间并行

策略进行加速，提高了图像分类速度。

上述几种方案都在

ＦＰＧＡ

上对神经网络进行部

署，但是此类加速器均要求对单一网络进行硬件上

的单一设计优化，灵活性较低，对于非专业硬件开发

人员来说，开发难度大、周期较长，难以适应快速迭

代的神经网络模型部署。因此，需要一种普适性强、

能够对基本的网络模型算子支持、开发周期短、开发

流程简洁的神经网络模型加速方法。

针对上述问题，本文提出了一种基于

ＦＰＧＡ＋

ＡＲＭ

异构平台的道路交通目标检测方案，通过增加

网络检测层得到改进的

ＹＯＬＯｖ３-４Ｌ

网络来提升模

型检测精度，通过剪枝、量化等方式降低网络的参数

和计算量得到

ＹＯＬＯｖ３-４Ｌ-ｐｒｕｎｅ

网络来提升检测速

度，在底层硬件端以深度处理单元（

ＤｅｅｐＬｅａｒｎｉｎｇ

ＰｒｏｃｅｓｓｉｎｇＵｎｉｔ

，

ＤＰＵ

）为核心，构建硬件平台对卷积

运算进行并行加速，在部署环节通过

Ｘｉｌｉｎｘ

公司

ＶｉｔｉｓＡＩ

平台进行网络量化、编译、生成执行文件等

方式对网络进行部署，实现了嵌入式平台道路交通

目标检测设计。

１

目标检测算法优化

ＹＯＬＯｖ３［

是一种广泛使用的目标检测算法，

通过回归的方式检测目标物体的种类和具体的位

置，其检测精度高、模型大小适中，适合部署到边缘

设备上。算法原始的

层特征尺度检测时部分微小

汽车目标以及重叠汽车目标会被漏检，改进

ＹＯＬＯｖ３-４Ｌ

网络结构如图

所示，本文对原始算法

结构进行了修改。

ＹＯＬＯｖ３

的原始主干网络为

Ｄａｒｋｎｅｔ-５３

，本文在

算法原有 3

层特征的基础上增加了第

４个特征尺度

（

１０４×１０４

），通过对其进行两倍上采样，将输出特征

尺度从

５２×５２

提升至

１０４ ×１０４

。同时通过

ｒｏｕｔｅ

层将第

１０９

层与特征提取网络的第

１１

层特征进行融

合，以充分利用深层特征和浅层特征，更好地识别微

小、重叠汽车目标。此外还进行了其他特征融合操

作：对通过

２

倍上采样输出的第

８５

层和第

９７

层网

络进行融合，通过

ｒｏｕｔｅ

层将第

８５

层与第

６１

层、

第

９７

层与第

３６

层的特征图进行融合。改进后的

４

个特征尺度分别为：

１０４ × １０４

、

５２ × ５２

、

２６ × ２６

和

１３×１３

。增加模型的特征尺度能够使多尺度的信息

进行融合，减轻特征丢失问题，提升语义的丰富度，

增强网络的全局感官能力，改善对汽车漏检、误检的

问题。

２

总体部署设计

２．１

硬件平台设计

本文硬件平台以

ＤＰＵ

作为核心，与实例化的

ＺＹＮＱＵｌｔｒａｓｃａｌｅ＋ＭＰＳｏＣＩＰ

核、时钟模块、复位模块

等各模块组合设计而成。

ＤＰＵ

是

Ｘｉｌｉｎｘ

推出的一个

可参数化的计算引擎，可以实现卷积神经网络模型、

深度神经网络模型的推理功能

［

１４

］

，硬件结构如图

２

所示。它相当于一组可参数化的

ＩＰ

核，部署在异构

平台的

ＦＰＧＡ

端中，

ＤＰＵ

有一个专用的指令集，该

指令集支持一些常用的神经网络算子如卷积、深度

卷积、最大池化和全连接等。

查看全文

http://www.dtcms.com/a/135866.html

5.9 《GPT-4调试+测试金字塔：构建高可靠系统的5大实战策略》

当纺织车间遇上“数字魔法”--天拓四方飞鸟物联平台+边缘计算采集网关的智造革命

记录待办事项的便签软件有没有推荐的？

TailwindCss快速上手

Halcon应用：九点标定-手眼标定

可灵AI进入2.0时代，全新视频生成模式将怎么改变市场？

Flutter 从零到一

Node.js 文件读取与复制相关内容

自然科技部分详解

Java开发中的设计模式之观察者模式详细讲解

音频炼金术：Threejs 让 3D 场景「听」起来更真实

邀请函 | 知从科技邀您共赴2025上海车展

【学习笔记】计算机网络（八）—— 音频/视频服务

Qwen2.5-Omni 部署框架选择指南：PyTorch vs. TensorFlow 深度对比

MCP协议，.Net 使用示例

Runnable和Callable接口的区别【简单易懂】

营销自动化实战指南：如何用全渠道工作流引爆线索转化率？

string的模拟实现 (6)

UE5游戏分辨率设置和窗口模式

【JAVA】bat文件启动jar场景获取bat文件路径的方法

回调函数用法详细讲解

L1-002 打印沙漏

libwebsocket建立服务器需要编写LWS_CALLBACK_ADD_HEADERS事件处理

[区块链lab2] 构建具备加密功能的Web服务端

基于javaEE+jqueryEasyUi+eclipseLink+MySQL的课程设计客房管理信息系统

【系统搭建】Ubuntu系统两节点间SSH免密配置

KALI搭建log4j2靶场及漏洞复现全流程

Uniapp：列表选择提示框

JSP技术入门指南【一】利用IDEA从零开始搭建你的第一个JSP系统

Docker Compose 命令实现动态构建和部署

相关文章：