当前位置: 首页 > news >正文

【论文阅读】Fast-BEV: A Fast and Strong Bird’s-Eye View Perception Baseline

题目:Fast-BEV: A Fast and Strong Bird’s-Eye View Perception Baseline
作者:Yangguang Li, Bin Huang, Zeren Chen, Yufeng Cui, Feng Liang, Mingzhu Shen,Fenggang Liu, Enze Xie, Lu ShengB, Wanli Ouyang, Jing Shao

motivation:
bev模式的检测逐渐成为主流,但是当前的算法资源消耗大或者效果不佳,作者提出又快又好的方法:FASTBEV.

methods:
1、Fast-Ray transformation
重新思考2D-3D映射思路

  • attention机制: 在这里插入图片描述
    通过attention的方法直接学习投射,难点在于投射的transformer-attention在车载平台的实际部署困难,算力大;
  • depth-based 方法通过
    在这里插入图片描述
    公式获得3d 特征: 难点在于计算量还是太大,当大的像素尺度下就遇到瓶颈了,或者无法在无gpu的设备上运行;
    于是作者的ray-projection,通过查表和多视觉到单体素的操作,极大的加速的2D-3D的投射速度;在CPU上表现也不错;
    具体流程如下:
    在这里插入图片描述
    在这里插入图片描述

2、 Multi-Scale Image Encoder
这个没得啥子好说的
在这里插入图片描述

3、Efficient BEV Encoder
4、Data Augmentation
5、Temporal Fusion

http://www.dtcms.com/a/292280.html

相关文章:

  • 【AI学习从零至壹】Transformer
  • AI入门学习-特征工程
  • 钢铁之躯的智慧觉醒:Deepoc具身智能如何重塑工业机械臂的“工艺直觉”
  • 虚幻 5 与 3D 软件的协作:实时渲染,所见所得
  • ClearML库详解:从实验跟踪到模型部署的全流程管理
  • FPGA自学——存储器模型
  • 立式数控深孔钻的工艺及光学检测方法 —— 激光频率梳 3D 轮廓检测
  • C语言---VSCODE的C语言环境搭建
  • 腾讯研究院 | AI 浪潮中的中国品牌优势解码:华为、小米、大疆、科大讯飞等品牌从技术破壁到生态领跑的全维突围
  • 宽带丢包重传高优化
  • 论文笔记 | Beyond Pick-and-Place: Tackling Robotic Stacking of Diverse Shapes
  • 2025.7.25论文阅读
  • 基于AutoJawSegment项目的CBCT图像分割实践指南
  • ES--为什么没有完全删除?
  • 机器人氩弧焊保护气降成本的方法
  • KGF60N65KDF-U/H KEC:650V超级硅MOSFET,超低导通电阻+超快开关速 电源设计专用!
  • 基于Spark图计算的社会网络分析系统
  • 一款基于 WPF 开源、功能全面的串口调试工具
  • 刘强东突然重仓机器人赛道,京东连投3家机器人公司
  • n8n - 为技术团队提供安全的自动化工作流
  • 16:00开始面试,16:06就出来了,问的问题有点变态。。。
  • iOS WebView 调试实战 localStorage 与 sessionStorage 同步问题全流程排查
  • Elasticsearch服务器开发(第2版) - 读书笔记 第一章 Elasticsearch集群入门
  • 传统RNN模型
  • NLP自然语言处理的一些疑点整理
  • 【CVPR 2025】即插即用DarkIR, 频域-空间协同的高效暗光恢复!
  • 深度学习 ---参数初始化以及损失函数
  • 从0到1学Pandas(一):Pandas 基础入门
  • Mixed Content错误:“mixed block“ 问题
  • React + ts 中应用 Web Work 中集成 WebSocket