点云识别模型汇总整理
点云识别模型主要分类:
目前主流的点云识别模型主要分为
- 基于点直接处理的方法:PointNet、PointNet++ 、DGCNN、 PointCNN、 Point Transformer、 RandLA-Net、 PointMLP、 PointNeXt ;
- 基于体素化的方法:VoxelNet、SECOND、PV-RCNN、3DmFV-Net ;
- 基于多视图的方法:MVCNN、RotationNet;
- 混合方法:PointPillars、PV-RCNN;
点云识别代表模型
模型 | 论文 | 代码 | 特点 |
---|---|---|---|
PointNet & PointNet++ | PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space | TensorFlow 实现 | 直接处理原始点云,PointNet 使用全局特征提取,PointNet++ 引入分层特征学习和局部特征聚合。 |
DGCNN (Dynamic Graph CNN) | Dynamic Graph CNN for Learning on Point Clouds | PyTorch 实现 | 通过动态图卷积捕获局部几何结构,适用于点云分类和分割。 |
PointCNN | PointCNN: Convolution On -Transformed Points | TensorFlow 实现 | 使用χ-Conv 操作对点云进行卷积,解决点云无序性问题。 |
KPConv (Kernel Point Convolution) | KPConv: Flexible and Deformable Convolution for Point Clouds | PyTorch 实现 | 基于点云的稀疏卷积核,支持灵活的感受野控制。 |
Point Transformer | Point Transformer | PyTorch 实现 | 将 Transformer 引入点云处理,利用自注意力机制建模长程依赖。 |
PV-RCNN (Point-Voxel CNN) | PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection | PV-RCNN | 结合体素和点特征的 3D 目标检测方法,平衡效率和精度。 |
3DmFV-Net | Search for a W’ boson decaying to a vector-like quark and a top or bottom quark in the all-jets final stat | 3DmFV-Net | 基于高斯混合模型(GMM)的体素特征表示,适用于分类和分割。 |
RandLA-Net | RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds | RandLA-Net | 高效的大规模点云语义分割,使用随机采样和局部特征聚合。 |
PointMLP | Rethinking Network Design and Local Geometry in Point Cloud: A Simple Residual MLP Framework | pointMLP-pytorch | 纯 MLP 结构,通过残差连接和几何仿射变换提升性能。 |
PointNeXt | PointNeXt: Revisiting PointNet++ with Improved Training and Scaling Strategies | PointNeXt | PointNet++ 的改进版,通过模块化设计提升泛化能力。 |
VoxelNet | VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection | Voxelnet | 早期体素化方法,使用3D卷积网络。 |
SECOND | Asynchronous Stochastic Composition Optimization with Variance Reduction | second.pytorch | 稀疏卷积优化VoxelNet,提升效率。 |
MVCNN | Very Deep Convolutional Networks for Large-Scale Image Recognition | mvcnn | 多视角2D投影+CNN融合,经典多视图方法。 |
RotationNet | RotationNet: Joint Object Categorization and Pose Estimation Using Multiviews from Unsupervised Viewpoints | rotationnet | 多视角+视角预测联合优化。 |
PointPillars | PointPillars: Fast Encoders for Object Detection from Point Clouds | PointPillars | 将点云转换为“伪图像”(柱状体素),适合实时检测。 |
框架集成:
Open3D-ML
MMDetection3D