【论文阅读】Fast-BEV: A Fast and Strong Bird’s-Eye View Perception Baseline
题目:Fast-BEV: A Fast and Strong Bird’s-Eye View Perception Baseline
作者:Yangguang Li, Bin Huang, Zeren Chen, Yufeng Cui, Feng Liang, Mingzhu Shen,Fenggang Liu, Enze Xie, Lu ShengB, Wanli Ouyang, Jing Shao
motivation:
bev模式的检测逐渐成为主流,但是当前的算法资源消耗大或者效果不佳,作者提出又快又好的方法:FASTBEV.
methods:
1、Fast-Ray transformation
重新思考2D-3D映射思路
- attention机制:
通过attention的方法直接学习投射,难点在于投射的transformer-attention在车载平台的实际部署困难,算力大; - depth-based 方法通过
公式获得3d 特征: 难点在于计算量还是太大,当大的像素尺度下就遇到瓶颈了,或者无法在无gpu的设备上运行;
于是作者的ray-projection,通过查表和多视觉到单体素的操作,极大的加速的2D-3D的投射速度;在CPU上表现也不错;
具体流程如下:
2、 Multi-Scale Image Encoder
这个没得啥子好说的
3、Efficient BEV Encoder
4、Data Augmentation
5、Temporal Fusion