当前位置: 首页 > news >正文

Scene as Occupancy

OccNet

https://github.com/OpenDriveLab/OccNet
Scene as Occupancy

  • 提出了一种新的场景表示方法, 利用环视摄像头,采用级联和时序体素编码的方式来重建三维Occ场景。
    在这里插入图片描述

Method

1)提出的OCCNet首先重建占据描述符,目标是为支持下游任务获取一个代表性的占据描述符。OCCNet采用了级联的方式(解码过程被分为多个阶段,每个阶段都负责恢复特定的信息),通过多个级联阶段的迭代,从鸟瞰图特征中解码3D占据特征。 2)使用了基于体素的时间自注意力和空间交叉注意力来恢复高度信息,并结合了可变形的3D注意力模块以提高效率。
在这里插入图片描述

  • Reconstruction of Occupancy
    OccNet使用Voxel尺度上的特征,但如果仅使用BEV特征,则无法充分恢复高度信息;但如果直接使用体素特征,则需要消耗大量算力。OccNet则在两者间寻求一个平衡点,先通过BEVFormer的encoder得到带有时序信息的BEV特征,再通过级联的decoder恢复3D占据特征。
    不同层级的decoder负责恢复不同高度尺度的信息。
    将前一帧的特征通过当前帧的参数进行变换,对于典型的自注意力机制,每一个query都需要与所有的key和value进行匹配,在3D特征下,这需要消耗大量的算力。因此,OccNet引入了可变形的3D注意力模块,从而大大降低了计算量。

  • Exploiting Occupancy on Various Tasks
    有了细粒度的3D场景表征,就可以应用于各种下游任务:

  1. 分割场景补全: 使用L1 Loss 和 Focal Loss来完成类别不平衡的场景补全任务
  2. 3D目标检测: 基于BEVFormer,将Occ重新投影到BEV视角,并使用query-based检测头进行3D目标检测
  3. BEV 语义分割: 基于ST-P3, 与三D目标检测一样,地图表征和语义分割是通过 BEV 特征预测的。BEV 分割头包括用于地图表示的可驾驶区域头和车道头,以及用于语义分割的车辆分割头和行人分割头。
  4. 运动规划:对于运动规划任务,感知结果都可以转换为BEV分割的形式,所有形式的结果都可以以0,1的形式表示。进一步就可以用于安全代价函数的计算中。

Experiment

在这里插入图片描述
在这里插入图片描述

OpenOcc

数据集真值的生成步骤:

  1. 根据带标签的物体点和部分背景点生成占位数据,其中黑点表示中间帧的未知背景点。
  2. 根据生成的占用率数据标注部分未知背景点。
  3. 去除其余被视为噪声的未知背景点。
  4. 对占用率数据进行后处理,以确保场景的完整性,如填补红色虚线框内的空洞。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
http://www.dtcms.com/a/309341.html

相关文章:

  • 深入剖析Spring IOC容器——原理、源码与实践全解析
  • Charles中文版抓包工具详解 实现API调试提效与流量分析优化
  • 肖特基二极管MBR0540T1G 安森美ON 低电压 高频率 集成电路IC 芯片
  • Linux 系统监控脚本实战:磁盘空间预警、Web 服务与访问测试全流程
  • 嵌入式 Linux 深度解析:架构、原理与工程实践(增强版)
  • 60 GHz DreamHAT+ 雷达已被正式批准为“Powered by Raspberry Pi”产品
  • 浏览器【详解】requestIdleCallback(浏览器空闲时执行)
  • CS224n:Word Vectors and Word Senses(二)
  • LOVON——面向足式Open-Vocabulary的VLN导航:LLM做任务分解、YOLO11做目标检测,最后L2MM将指令和视觉映射为动作,且解决动态模糊
  • 九联UNT403HS_海思MV320处理器_安卓9-优盘强刷刷机包
  • 从内部保护你的网络
  • Android ConstraintLayout 使用详解
  • CAN总线协议
  • 【机器学习与数据挖掘实战 | 医疗】案例20:基于交叉验证和LightGBM算法的糖尿病遗传风险预测
  • FastDDS (SharedMemory)
  • Mysql监控数据库
  • synchronized 深度剖析:从语法到锁升级的完整演进
  • VSCode:通义灵码插件安装使用 -- 免费AI编程工具
  • 登录校验一
  • 抢占先机,PostgreSQL 中级专家认证的职业跃迁
  • 逻辑回归在银行贷款审批中的应用:参数选择与实践
  • grafana/lock-stack 日志 Pipeline 配置
  • 性能监控体系:InfluxDB Grafana Prometheus
  • 【东枫科技】DreamHAT+
  • 3D 建模核心术语扫盲:拓扑、UV 展开、烘焙与 AO 贴图解析
  • 关于“PromptPilot” 之5 -标签词与标签动作的语言模型九宫格
  • c#中switch case语句的用法
  • Go语言的gRPC教程-拦截器
  • 向华为学习——IPD流程体系之IPD术语
  • 译 | BBC Studios团队:贝叶斯合成控制方法SCM的应用案例