当前位置: 首页 > news >正文

【论文笔记】RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar

原文链接:https://arxiv.org/abs/2405.14014

1. 任务定义

给定4D雷达张量(4DRT)V∈RR×A×E×DV\in\mathbb R^{R\times A\times E\times D}VRR×A×E×D,目标是预测3D占用O={oi}i=1H×W×LO=\{o_i\}_{i=1}^{H\times W\times L}O={oi}i=1H×W×L,其中oi∈{c0,c1,⋯,cC}o_i\in\{c_0,c_1,\cdots,c_C\}oi{c0,c1,,cC}为空(c0c_0c0)或某个类别ci(i>0)c_i(i>0)ci(i>0)。4DRT的R,A,E,DR,A,E,DR,A,E,D分别为距离、水平角、俯仰角和多普勒维度的区间数,且元素为测量的功率。

2. 概述

在这里插入图片描述
RadarOcc包含4个组件。在输入网络前,4DRT的体积会被压缩,以在不损失关键信息的条件下提高效率。为避免插值误差,本文直接在球坐标下编码空间特征,而不转化到笛卡尔坐标下;此后与笛卡尔坐标下定义的3D体查询交互。逐距离的自注意力用于减轻旁瓣,稀疏卷积和可变形注意力用于快速编码和聚合。

3. 数据体积压缩

原始的4DRT几乎不可能直接使用(平均每帧500MB)。本文通过多普勒频段描述符编码以及旁瓣感知的空间稀疏化操作来减少数据体积。

3.1 多普勒频段描述符

与之前的方法将多普勒维度进行池化操作不同,本文认为多普勒维度的峰值位置和功率分布分别反应了物体的速度和置信度。本文将多普勒区间编码为描述符,取前三峰值功率及其对应索引,再加上平均功率和标准差。这样,数据被压缩为原来的D/8D/8D/8,同时保留了多普勒维度的关键信息。

3.2 旁瓣感知的空间稀疏化

过去的方法通过保留一定百分比的高功率元素来生成稀疏张量,进一步减小数据量。但如下右图所示,留下的大量元素均位于相同距离,表现为旁瓣的伪影。
在这里插入图片描述
本文选择每个距离下的前NrN_rNr个元素(基于多普勒维度的平均功率),从而减轻旁瓣。稀疏张量表示为T={ti∈RNr×(8+2)}i=1RT=\{t_i\in\mathbb R^{N_r\times (8+2)}\}_{i=1}^{R}T={tiRNr×(8+2)}i=1R。额外的两个维度存储水平角和俯仰角索引。

4. 基于球坐标的特征编码

过去的方法将稀疏张量由极坐标转化为笛卡尔坐标进行编码,但这样会引入插值误差并破坏其均匀密度分布。本文直接在距离-水平角-俯仰角维度进行3D稀疏卷积。

4.1 逐距离的自注意力

为进一步减轻旁瓣影响,本文使用逐距离的自注意力机制作为初始特征编码操作。对每个距离下的元素ti∈Tt_i\in TtiT,使用8维多普勒频段描述符作为特征,2维索引被用于位置编码。

4.2 序列稀疏卷积

使用一组3D稀疏卷积编码球坐标稀疏体素,最后转化为密集3D特征F∈RRS×AS×ES×CfF\in\mathbb R^{\frac RS\times\frac AS\times\frac ES\times C_f}FRSR×SA×SE×Cf

4.3 可变形自注意力

使用3D可变形注意力,通过空间交互进一步细化和增强特征FFF
frq=DeformAttn(fq,pq,F)f_r^q=DeformAttn(f^q,p^q,F)frq=DeformAttn(fq,pq,F)

其中fqf^qfqFFF的元素)为查询特征,pqp^qpq为其对应的参考点,frqf_r^qfrq为更新后体素FrF_rFr的元素。

5. 球坐标到笛卡尔坐标的特征聚合

首先建立基于网格的查询H={hq∈RCf}q=1H×W×LH=\{h^q\in\mathbb R^{C_f}\}_{q=1}^{H\times W\times L}H={hqRCf}q=1H×W×L(大小与占用网格相同,特征维度与FrF_rFr相同),每个查询hqh^qhq对应了笛卡尔坐标下的一个3D点pqp^qpq。将pqp^qpq转化到球坐标下,并映射为FrF_rFr中的索引Φ(pq)\Phi(p^q)Φ(pq),作为参考点。执行可变形交叉注意力,得到输出G={gq∈RCf}q=1H×W×LG=\{g^q\in\mathbb R^{C_f}\}_{q=1}^{H\times W\times L}G={gqRCf}q=1H×W×L
gq=DeformAttn(hq,Φ(pq),Fr)g^q=DeformAttn(h^q,\Phi(p^q),F_r)gq=DeformAttn(hq,Φ(pq),Fr)

6. 3D占用解码和监督

使用3D卷积逐步下采样GGG得到NsN_sNs个尺度的特征,并上采样到同一大小拼接,得到Gd∈RH×W×L×NsCfG_d\in\mathbb R^{H\times W\times L\times N_sC_f}GdRH×W×L×NsCf。最后,使用占用头得到占用概率O~∈[0,1]H×W×L×(C+1)\tilde O\in[0,1]^{H\times W\times L\times (C+1)}O~[0,1]H×W×L×(C+1)

使用真实占用监督。交叉熵损失作为主要损失,lovasz-softmax损失用于处理类别不平衡。此外还使用逐场景和逐类别的亲和度损失。


文章转载自:

http://1Ed18e0d.nzqqd.cn
http://gUlEEvId.nzqqd.cn
http://hhOT3bqN.nzqqd.cn
http://qGahd3uG.nzqqd.cn
http://63nFImIF.nzqqd.cn
http://uenvq57o.nzqqd.cn
http://yH0MAdCD.nzqqd.cn
http://l63V4zuB.nzqqd.cn
http://9W1FeKnR.nzqqd.cn
http://PwR5ICL8.nzqqd.cn
http://GSGFNxFb.nzqqd.cn
http://vjuc7Tc6.nzqqd.cn
http://vFPsvHfb.nzqqd.cn
http://zMQlRVvw.nzqqd.cn
http://ffj6JRSn.nzqqd.cn
http://6vzrUeGa.nzqqd.cn
http://T4BnR9xi.nzqqd.cn
http://VkXTl0XA.nzqqd.cn
http://6gxx5KC6.nzqqd.cn
http://X8QnxDoc.nzqqd.cn
http://LpCC1R8K.nzqqd.cn
http://R7TZaxF2.nzqqd.cn
http://HkgRGzyF.nzqqd.cn
http://780ZxuwY.nzqqd.cn
http://1fMbIvKc.nzqqd.cn
http://4Y67EJDW.nzqqd.cn
http://0deMH8tM.nzqqd.cn
http://8nmmISir.nzqqd.cn
http://KedOO8Z5.nzqqd.cn
http://b17Bobxi.nzqqd.cn
http://www.dtcms.com/a/379906.html

相关文章:

  • 【Axios 教程】从入门到高级
  • 数据库重演Real Application Testing: Database Capture FAQ (Doc ID 1920275.1)
  • 一个海康相机OCR的程序
  • 蚂蚁 S19 Pro+ Hyd 191T:高效能矿机解析与性能评测
  • C++并发编程:std::thread右值形式传参解析
  • 判断子序列
  • 鸿蒙数据安全实战:从 AES 到 RSA 的加密解密全流程解析
  • Python与MiniKanren:逻辑编程的艺术与科学
  • DeviceNet 转 EtherCAT:发那科焊接机器人与倍福 CX5140 在汽车焊装线的高速数据同步通讯配置案例
  • J002 Vue+SpringBoot电影推荐可视化系统|双协同过滤推荐算法评论情感分析spark数据分析|配套文档1.34万字
  • 连续hash函数
  • 七彩喜智慧养老:用科技温暖晚年,让关爱永不掉线
  • C++微基础蓝桥杯之旅9.9-9.12
  • 一款好看的jQuery前端框架-HisUI
  • Go语言io.Copy深度解析:高效数据复制的终极指南
  • k8s-init容器学习
  • 【算法磨剑:用 C++ 思考的艺术・Dijkstra 实战】弱化版 vs 标准版模板,洛谷 P3371/P4779 双题精讲
  • Java大厂面试实录:产业互联网大数据与AI服务场景下的微服务与智能搜索(含详细解读)
  • 苍穹外卖项目笔记day08
  • 智能逗猫球方案MCU控制方案浅析-智能宠物玩具,宠物解闷神器
  • Unity键盘控制角色运动
  • 大数据毕业设计-基于Spark的全国高速公路实时路况融合与拥堵预测系统(高分计算机毕业设计选题·定制开发·真正大数据)
  • zmq源码分析之session
  • Xcode 上传 ipa 全流程详解 App Store 上架流程、uni-app 生成 ipa 文件上传与审核指南
  • Java 泛型详解:从基础到高级应用
  • 第6.2节 Android Agent开发<二>
  • ubuntu挂载新硬盘的方法
  • Kubernetes Ingress:使用 Apache APISIX 进行外部流量路由
  • 初学者如何选择适合的云平台进行AIGC训练?
  • Docker存储卷(Volume)完全指南:从入门到精通