当前位置: 首页 > news >正文

BEVDepth- Acquisition of Reliable Depth for Multi-view 3D Object Detection

中科院 旷视 AAAI 2023

纯视觉多相机BEV方案检测模型

code:https://github.com/Megvii-BaseDetection/BEVDepth

paper:BEVDepth: Acquisition of Reliable Depth for Multi-View 3D Object Detection| Proceedings of the AAAI Conference on Artificial Intelligence

输入:N帧环视相机

过程:

  1. CNN抽2D图像特征
  2. DepthNet从2D特征建模深度
    1. 点云+相机内外参计算图像深度信息(2.5D图像)
    2. min pooling+one hot,计算深度真值
    3. depth网络里加残差、deformable conv扩大感受野,抵消相机外参变化带来的影响(?)
    4. camera-awareness DepthNet
      1. 目的:提升深度分类效果
      2. 方案:相机内参作为DepthNet网络输入
        1. MLP层:expand内参到特征同维数
        2. SE层:融合2D特征+相机内外参
    5. 提效voxel pooling 
      1. 方案:自定义cuda算子VoxelPoolingTrain
  3. view transformer用2D图像特征+深度获取3D特征,再投射成bev表征
  4. CenterPoint 3D检测头识别检测框(class,3Dbox offset,属性等)

相关文章:

  • 数据库管理与高可用-MySQL数据库操作
  • C# Datatable筛选过滤各方式详解
  • 智变与重构:AI 赋能基础教育教学的范式转型研究报告
  • jmeter对数据库进行单独压测
  • 黑马程序员C++核心编程笔记--3 函数高级
  • 【前端】【css预处理器】Sass与Less全面对比与构建对应知识体系
  • Visual Studio 的下载安装
  • 22.代理模式:思考与解读
  • Spring AI 代理模式(Agent Agentic Patterns)
  • element ui 表格 勾选复选框后点击分页不保存之前的数据问题
  • React-native的新架构
  • MySQL 自增 ID 达到上限,如何巧妙化解危机
  • 力扣100题---字母异位词分组
  • Denoising Autoencoders 视频截图 DAEs简单实现 kaggle 去噪编码器
  • 计算机网络 | 1.1 计算机网络概述思维导图
  • 能按需拆分 PDF 为多个文档的工具
  • 集成电路制造设备防震基座选型指南:为稳定护航-江苏泊苏系统集成有限公司
  • 27、请求处理-【源码分析】-怎么改变默认的_method
  • Rust 学习笔记:使用迭代器改进 minigrep
  • 电脑硬盘空间大量被占用怎么办
  • 做淘宝浏览单的网站/方象科技专注于什么领域
  • 大理公司网站建设/电商网络推广怎么做
  • 甘肃省城乡住房建设厅网站/软件测试培训费用大概多少
  • 学校网站建设源代码/seo项目完整流程
  • 收到网站建设账务处理/谷歌浏览器入口
  • 四川省建设厅网站在线申报/营销网页