当前位置: 首页 > news >正文

CaDDN- Categorical Depth Distribution Network for Monocular 3D Object Detection

CVPR 2021 

单目纯视觉BEV检测模型

paper:https://arxiv.org/pdf/2103.01100

code:https://github.com/TRAILab/CaDDN

  1. 视椎特征网络(和LSS做法一致,对深度有监督学习)
    1. DNN模块,抽图像特征
      1. 输入:
      2. 输出:,D:深度桶的数量,C:特征通道数
    2. 深度特征模块
      1. 输入:图像特征
      2. 输出:,对每个像素生成一个深度分布,再softmax后作为分桶结果
      3. 分桶方式:每个桶大小线性增加 linear-increasing discretization(LID)
        1.  di:索引号
    3. 点乘融合
      1. 输入:图像特征(reduce降通道后),深度分布
      2. 输出:视椎特征G
  2. 视椎特征转voxel特征(和LSS做法一致)
    1. 输入:,视椎采样点,相机参数
    2. 输出:
    3. 做法:
      1. 视椎采样点用相机参数转到voxel索引
      2. 用上一阶段网络输出的深度(桶索引),去视椎特征G中抽取voxel特征V,在G对应位置周围用trilinear采样
  3. voxel特征转bev特征
    1. 输入:
    2. 输出:
    3. 做法:直接reshape
  4. DNN detector+head
    1. 采用PointPillars模块结构
  5. loss:
    1. 深度监督:
      1. focal loss,前背景像素α:3.25/0.25
    2. 整体模型:
      1. dir:回归框朝向
      2. 0.2

其他附图:

感觉paper风格偏工程

相关文章:

  • PYTORCH_CUDA_ALLOC_CONF基本原理和具体示例
  • DDR5和LPDDR5的CA采样时刻对比,含DDR5的1N/2N模式
  • redis搭建最小的集群,3主3从
  • 华为昇腾开发——多模型资源管理(C++)
  • flutter dart class语法说明、示例
  • 微信小程序 隐私协议弹窗授权
  • 关于数据仓库、数据湖、数据平台、数据中台和湖仓一体的概念和区别
  • 视频文件损坏怎么修复?4款专业视频修复工具推荐
  • 大模型应对大风等极端天气的卓越效果及其在能源预测中的特殊价值
  • 即将截稿|快速出版:IEEE 2025先进能源系统和电力电子国际会议(AESPE2025)
  • 广州能源所重大突破:闪蒸焦耳加热助力粉煤灰 / 赤泥中关键金属低碳回收
  • 数字孪生技术如何重塑能源产业?
  • 2025年气候持续大风,消纳减少,如何保收益?东润能源整体解决方案持续保收益保增长
  • 零碳办会新范式!第十届国际贸易发展论坛——生物能源和可持续发展专场,在京举办
  • SpringAI 大模型应用开发篇-SpringAI 项目的新手入门知识
  • Femap许可证兼容性问题
  • 并发编程 之 Java内存模型、AQS详解:AQS设计思想、Unsafe
  • MySQL与Redis数据同步实践与优化
  • B2160 病人排队
  • 戴尔电脑怎么开启vt_戴尔电脑新旧bios开启vt虚拟化图文教程
  • wordpress 消息机制/seo优化范畴
  • 帮别人做网站的公司/宁波seo优化费用
  • 如何运营自己的网店/seo店铺描述例子
  • 网页界面设计用什么软件/长沙seo优化排名
  • 个人网站做交易类的赚钱吗/苏州网站建设费用
  • 做网站注册页面/软件外包网站