当前位置: 首页 > news >正文

DETR3D- 3D Object Detection from Multi-view Images via 3D-to-2D Queries

MIT CORL 2021

纯视觉BEV方案transformer网络3D检测

paper:[2110.06922] DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries

code:GitHub - WangYueFt/detr3d

  1. DNN提图像特征,FPN提多尺度特征
  2. pts_bbox_head Detr3DHead

    1. transformer Detr3DTransformer
      1. Detr3DHead__init__self.query_embedding = nn.Embedding(self.num_query, self.embed_dims * 2)forwardquery_embeds = self.query_embedding.weighths, init_reference, inter_references = self.transformer(mlvl_feats,query_embeds,reg_branches=self.reg_branches if self.with_box_refine else None,  # noqa:E501img_metas=img_metas,)Detr3DTransformer__init__self.embed_dims = self.decoder.embed_dimsself.reference_points = nn.Linear(self.embed_dims, 3)forward(self, mlvl_feats, query_embed, reg_branches=None, **kwargs):query_pos, query = torch.split(query_embed, self.embed_dims , dim=1)query_pos = query_pos.unsqueeze(0).expand(bs, -1, -1)reference_points = self.reference_points(query_pos).sigmoid()

      2. Detr3DCrossAtten

      3. MultiheadAttention

    2. bbox_coder NMSFreeCoder

    3. loss_cls FocalLoss

相关文章:

  • 20250523-在Unity中创建角色动画(2D)(Set up Animator with State Machine)
  • Makefile快速入门
  • PCB设计实践(二十五)贴片电阻与插件电阻的全面解析:差异、演进与应用场景
  • Python打卡第34天
  • 纸牌游戏(基于集合,和自定义排序实现)
  • MIAOYUN受邀参加“创投天府·周周见”活动,以AI原生技术赋能科创产业新生态
  • 2000-2023年各地级市进出口总额/地级市对外经济贸易数据
  • Python图像处理基础(四)
  • 【三维重建】【3DGS系列】【深度学习】3DGS的理论基础知识之如何控制高斯椭球
  • 详解osgb的顶点,纹理,索引,UV读取与存储
  • PyQt学习系列04-多线程与异步编程
  • 3362. 零数组变换 III
  • Honeywell CV-DINA-DI1624-2A 数字输入模块
  • 【Web前端】JavaScript入门与基础(一)
  • 【软件测试】第三章·软件测试基本方法(逻辑覆盖、路径覆盖)
  • Redis 缓存使用的BigKey问题
  • Cesium基础对象介绍
  • MySQL别名规则与应用场景
  • 矩阵详解:线性代数在AI大模型中的核心支柱
  • 【ICL】上下文学习
  • 网站变灰色 html/百度一下一下你就知道
  • 哪个网站做原创歌曲/抖音视频排名优化
  • 微商做百度推广发哪个网站收录高/谷歌seo是什么职业
  • 邢台建设一个企业网站/网推资源渠道
  • 网站建设与推广的步骤/关键词优化排名详细步骤
  • 青岛微网站/域名ip查询查网址