当前位置: 首页 > news >正文

【自动驾驶】《Sparse4Dv3》代码学习笔记

这里时间比较有限,优先看Sparse4Dv3方法里面相对以前改动的地方。

0.参考

代码v1/v2/v3:https://github.com/HorizonRobotics/Sparse4D

跑起来:https://github.com/HorizonRobotics/Sparse4D/blob/v3.0/docs/quick_start.md

1.方法

(1)时序实例去噪(3D)

代码解析:在head的InstanceBank模块中,两组kmeans提前初始化好的均匀分布锚点:nuscenes_kmeans900.npy,然后另外一组锚点,通过SparseBox3DKeyPointsGenerator模块进行forward噪声生成,然后通过二分图匹配(在哪?)。通过时间差,补偿锚点的中心点、尺寸、yaw、速度等。

(2)质量估计 (Quality Estimation)

代码解析:下面三张图,由配置文件,可以知道是用到了质量估计这个模块的。

代码解析:下面三张图,由配置文件,可以知道中心点的使用的交叉熵损失函数,而yaw角度的优化,使用的高斯focal loss损失函数进行优化。看起来跟论文中的是正好反过来的!!!

(3)解耦注意力 (Decoupled Attention)

将锚点独立的高维特征编码 (independently conduct high-dimensional feature encoding),随后将它们拼接 (concatenate) 起来。将与原始 Sparse4D 相比,这种方法带来了更低的计算量和参数开销 (lower computational and parameter overhead)。然后E 和 F 分别代表锚点嵌入 (anchor embedding) 和实例特征 (instance feature)也拼接起来。

代码解析:我们可以看到将a这个独立高维特征编码后进行add或者concatenate操作,其中是进行add还是cat操作通过self.mode这个参数进行配置的。head中anchor_encoder中type=“SparseBox3DEncoder”对应 mode=“cat”。

(4)扩展到追踪 (Extend to Tracking)

代码解析:Sparse4DHead中forward,通过调用instance_back.get返回instance_feature与anchor  作为R;

代码解析:Sparse4DHead中forward,通过调用instance_back.cache,将topk的instance_feature存在cache中;

代码解析:Sparse4DHead中forward,通过调用instance_back.get_instance_id,如果id为空或置信度>threshold,给赋新的id(self.pred_id基础上+i);

2.结果

v3增加了track的任务,帧率上降低并不多。mAP提升了2.5个点,对于IDS可能还需要做一些优化。

http://www.dtcms.com/a/320124.html

相关文章:

  • Redis的五个基本类型(2)
  • 单页面应用(SPA)和多页面应用(MPA)
  • RP2040下的I2S Slave Out,PIO状态机(三)
  • pybind11 的应用
  • (Python)Python爬虫入门教程:从零开始学习网页抓取(爬虫教学)(Python教学)
  • 腾讯iOA技术指南:实现数据防泄漏与高级威胁防护
  • Spark Memory 内存设计的核心组件、对比Flink内存配置
  • langchain入门笔记02:几个实际应用
  • 生信分析进阶16 - 可准确有效地检测血浆 ccf-mtDNA 突变的分析方法
  • DrissionPage实战案例:小红书旅游数据爬取
  • 串口转ADC/PWM 串口转I2C 串口转GPIO工具
  • c++20--std::format
  • 工业相机使用 YOLOv8深度学习模型 及 OpenCV 实现目标检测简单介绍
  • 计算机视觉CS231n学习(4)
  • jmeter要如何做接口测试?
  • python源码是如何运行起来的
  • HTTPS是如何确保网站安全性的?
  • 【Apache Olingo】全面深入分析报告-OData
  • 使用Ollama本地部署DeepSeek、GPT等大模型
  • C++模拟法超超超详细指南
  • 连续最高天数的销售额(动态规划)
  • 如何让keil编译生成bin文件与反汇编文件?
  • 机器学习:线性回归
  • Win10桌面从默认C盘改到D盘
  • 小红书开源多模态视觉语言模型DOTS-VLM1
  • 深入剖析React框架原理:从虚拟DOM到Fiber架构
  • PCA9541调试记录
  • 软考中级【网络工程师】第6版教材 第2章 数据通信基础(下)
  • ansible 操作家族(ansible_os_family)信息
  • 网页中 MetaMask 钱包钱包交互核心功能详解