当前位置：首页 > news >正文

BEVDepth- Acquisition of Reliable Depth for Multi-view 3D Object Detection

news 来源：原创 2025/5/30 21:17:30

中科院旷视 AAAI 2023

纯视觉多相机BEV方案检测模型

code：https://github.com/Megvii-BaseDetection/BEVDepth

paper：BEVDepth: Acquisition of Reliable Depth for Multi-View 3D Object Detection| Proceedings of the AAAI Conference on Artificial Intelligence

输入：N帧环视相机

过程：

CNN抽2D图像特征
DepthNet从2D特征建模深度
1. 点云+相机内外参计算图像深度信息（2.5D图像）
2. min pooling+one hot，计算深度真值
3. depth网络里加残差、deformable conv扩大感受野，抵消相机外参变化带来的影响（？）
4. camera-awareness DepthNet
  1. 目的：提升深度分类效果
  2. 方案：相机内参作为DepthNet网络输入
    1. MLP层：expand内参到特征同维数
    2. SE层：融合2D特征+相机内外参
5. 提效voxel pooling
  1. 方案：自定义cuda算子VoxelPoolingTrain
view transformer用2D图像特征+深度获取3D特征，再投射成bev表征
CenterPoint 3D检测头识别检测框（class，3Dbox offset，属性等）

相关文章：

数据库管理与高可用-MySQL数据库操作

C# Datatable筛选过滤各方式详解

智变与重构：AI 赋能基础教育教学的范式转型研究报告

jmeter对数据库进行单独压测

黑马程序员C++核心编程笔记--3 函数高级

【前端】【css预处理器】Sass与Less全面对比与构建对应知识体系

Visual Studio 的下载安装

22.代理模式：思考与解读

Spring AI 代理模式（Agent Agentic Patterns）

element ui 表格勾选复选框后点击分页不保存之前的数据问题

React-native的新架构

MySQL 自增 ID 达到上限，如何巧妙化解危机

力扣100题---字母异位词分组

Denoising Autoencoders 视频截图 DAEs简单实现 kaggle 去噪编码器

计算机网络 | 1.1 计算机网络概述思维导图

能按需拆分 PDF 为多个文档的工具

集成电路制造设备防震基座选型指南：为稳定护航-江苏泊苏系统集成有限公司

27、请求处理-【源码分析】-怎么改变默认的_method

Rust 学习笔记：使用迭代器改进 minigrep

电脑硬盘空间大量被占用怎么办

做淘宝浏览单的网站/方象科技专注于什么领域

大理公司网站建设/电商网络推广怎么做

甘肃省城乡住房建设厅网站/软件测试培训费用大概多少

学校网站建设源代码/seo项目完整流程

收到网站建设账务处理/谷歌浏览器入口

四川省建设厅网站在线申报/营销网页