SuperGlue:基于图神经网络的特征匹配技术解析
在计算机视觉领域,特征匹配是三维重建、SLAM(同步定位与地图构建)等任务的核心环节。SuperGlue 作为一种创新性的神经网络模型,通过结合图神经网络与注意力机制,实现了对两组局部特征的高效匹配,同时能有效剔除不可匹配的点。
一、核心定位:连接前端与后端的 "中间层"
传统的特征匹配流程通常分为前端特征提取与后端姿态估计,而 SuperGlue 创新性地提出了 "可学习中间层" 的概念:
前端:由特征检测器(如 SuperPoint)负责提取图像的局部特征(关键点位置与视觉描述符)
中间层:SuperGlue 接收前端输出的特征,通过图神经网络与注意力机制建立特征间的对应关系
后端:利用匹配结果进行姿态估计或光束平差等优化操作
这种架构设计打破了传统匹配中依赖人工设计启发式规则的局限,通过端到端训练学习 3D 世界的几何变换先验,大幅提升了复杂场景下的匹配鲁棒性。
二、输入特征的处理:融合位置与外观信息
SuperGlue 的输入包含两组图像的局部特征,每组特征由关键点位置