当前位置: 首页 > news >正文

【三维重建-算法解析】MVS(Multi-View Stereo,多视图立体)

文章目录

    • 一、MVS 是什么?
    • 二、MVS 的典型流程
    • 三、核心原理与方法
      • 1. 特征匹配与图像几何关系
      • 2. 深度假设与代价计算
      • 3. PatchMatch MVS:随机搜索与传播策略
      • 4. 深度图融合(Depth Map Fusion)
    • 四、深度学习时代的 MVS:神经网络的加入
      • 代表方法
    • 五、经典 MVS 工具链与开源项目
    • 六、MVS 的挑战与发展趋势
    • 七、总结
    • 参考资料

一、MVS 是什么?

MVS(Multi-View Stereo,多视图立体) 是三维重建领域的核心技术之一。它的目标是:

在已知多个视角的相机位姿和图像的情况下,恢复场景中每个像素的三维结构(深度或点云)。

简单来说:

  • 输入: 多张图像 + 每张图像的相机参数(外参与内参)
  • 输出: 稠密点云或深度图

MVS 通常位于三维重建流程的 中后阶段,其前端通常由 SfM(Structure from Motion) 提供相机姿态与稀疏点云,后端 MVS 再将这些稀疏点扩展为稠密的三维结构。


二、MVS 的典型流程

一个完整的 MVS 管线通常包括以下步骤:

输入:多张已配准图像(及相机参数)
↓
1 图像匹配(Feature Matching)
2 深度假设生成(Depth Hypothesis)
3 代价计算(Matching Cost Computation)
4 代价聚合(Cost Aggregation)
5 深度优化与选择(Depth Refinement)
6 稠密点云融合(Depth Map Fusion)
↓
输出:稠密点云或表面模型

下面我们逐步展开。


三、核心原理与方法

1. 特征匹配与图像几何关系

MVS 的前提是已知每个相机的位姿,因此可以通过 极线约束(Epipolar Constraint) 将匹配搜索限制在一条极线上,从而减少计算量。

对于每个像素 ( p ) 在参考图像中,我们希望找到在其他图像中的对应点 ( p’ ),满足几何一致性。


2. 深度假设与代价计算

在每个像素处,MVS 会假设一系列可能的深度 ( d ),并根据该深度将该点反投影到三维空间,再投影到其他图像上,计算颜色一致性代价。

常见的代价函数包括:

  • NCC(Normalized Cross-Correlation)
  • ZNCC(Zero-mean NCC)
  • SSIM(Structural Similarity)
  • L1 / L2 光度误差

数学表达式(以 NCC 为例):
[
C(p, d) = 1 - \frac{\sum_i (I_r§ - \bar{I}_r)(I_i(p_i) - \bar{I}_i)}{\sqrt{\sum_i (I_r§ - \bar{I}_r)^2 \sum_i (I_i(p_i) - \bar{I}_i)^2}}
]


3. PatchMatch MVS:随机搜索与传播策略

近年来最主流的传统算法之一是 PatchMatch MVS(PM-MVS),其灵感来自图像修复算法 PatchMatch

核心思想:

  • 随机初始化深度与法线
  • 基于邻域传播优化深度
  • 利用视角一致性筛选匹配

优点:

  • 收敛速度快
  • 并行性强
  • 精度高

代表实现:

  • COLMAP MVS
  • OpenMVS
  • ACMM / ACMH / ACMP 系列算法

4. 深度图融合(Depth Map Fusion)

每张参考图像都会生成一个深度图,为了得到一致的稠密三维结构,需要将这些深度图融合。

常见方法:

  • 基于投票的融合(如 COLMAP)
  • 基于 TSDF(Truncated Signed Distance Function) 的体素融合
  • 基于点云置信度的加权平均

最终输出为稠密点云,后续可用 Poisson Surface Reconstruction 等方法生成网格。


四、深度学习时代的 MVS:神经网络的加入

自 2018 年 MVSNet 提出后,MVS 进入了深度学习阶段。
主要思路:使用卷积网络直接学习从多视角图像到深度体积(Depth Volume)的映射。

代表方法

方法发表年份核心思路特点
MVSNet2018构建 cost volume + 3D CNN 回归深度首个端到端网络
R-MVSNet2019记忆优化 + 可变深度采样支持高分辨率
CVP-MVSNet2020逐级 coarse-to-fine 深度预测速度与精度平衡
PatchMatchNet2021引入 PatchMatch 思想轻量快速
GeoMVSNet / CasMVSNet2021+分层金字塔式网络多尺度鲁棒

五、经典 MVS 工具链与开源项目

以下是常用的 MVS 工具与框架:

工具类型说明
COLMAP传统 MVS最流行的 SfM + MVS 工具
OpenMVS传统 MVS高性能、可扩展
MVE传统 MVS学术界常用
MVSNet / CasMVSNet / PatchMatchNet深度学习 MVS高精度端到端方法
Nerf / Nerfacto神经重建与 MVS 结合趋势显著

六、MVS 的挑战与发展趋势

挑战说明
纹理缺乏在无特征区域(如白墙)中难以匹配
遮挡与反射多视角间出现遮挡或镜面反射时误差大
计算复杂度高深度估计体积庞大、计算代价高
跨模态适应性差不同光照、相机参数下匹配稳定性低

未来趋势:

  • 融合深度学习与几何约束(Hybrid MVS)
  • 神经体积表示(Neural Radiance Field, NeRF)
  • 实时 MVS(Real-time MVS)
  • 大规模场景重建(City-level Reconstruction)

七、总结

阶段关键词技术代表
传统几何时代PatchMatch, ZNCCCOLMAP, OpenMVS
深度学习时代Cost Volume, 3D CNNMVSNet, CasMVSNet
神经重建时代Implicit Fields, NeRFInstant-NGP, Nerfacto

一句话总结:

MVS 是连接“相机几何”与“真实三维世界”的桥梁,
它让我们从二维图像中,真正“看见”了三维世界。


参考资料

  1. Yao et al., MVSNet: Depth Inference for Unstructured Multi-view Stereo, CVPR 2018.
  2. Schönberger et al., COLMAP: A General-purpose Structure-from-Motion and MVS Pipeline, CVPR 2016.
  3. Galliani et al., Massively Parallel Multi-View Stereo Reconstruction by Surface Normal Diffusion, ICCV 2015.
  4. Zhang et al., PatchMatchNet: Learned Multi-View PatchMatch Stereo, CVPR 2021.
  5. OpenMVS 官方文档: https://cdcseacave.github.io/openMVS
http://www.dtcms.com/a/461436.html

相关文章:

  • 【GPT5系列】ChatGPT5 提示词工程指南
  • 61850协议GOOSE通信AB网通信
  • wordpress开启子站找公司做网站有什么好处
  • SpringBoot+Redis实现电商秒杀方案
  • 电子商务网站模板 html数据型网站
  • 【QT常用技术讲解】QSerialPort串口开发,包含文件发送功能
  • STM32 外设驱动模块【含代码】:SG90 舵机模块
  • 深圳城乡和住房建设局网站263企业邮箱官网登录
  • K8s概念基础(一)
  • 计算机视觉毕业设计选题该如何选?——根据自身情况合理选择
  • 返利网一类的网站怎么做深圳好看的网站建设哪家公司好
  • 2025-2031年全球 MT 插芯市场全景分析报告:技术演进、供需格局与投资前景
  • 优化的网站做域名跳转做网站现在什么尺寸合适
  • 北京网站建设中企云达电商平台项目运营策划方案
  • 符号主义对人工智能自然语言处理中深层语义分析的影响与启示
  • Excel 常用功能自救手册:遇到问题快速排查指南 (个人备忘版)
  • Excel 数据自动校对:AI 助力精准对比与高效复核
  • 迅为RK3568开发板OpenHarmony系统南向驱动开发手册-实操-HDF驱动配置LED-新增topeet子系统
  • 提供佛山顺德网站建设宜宾注册公司
  • AI原生应用架构白皮书 - AI应用开发框架及上下文工程
  • 北京品牌网站建设公司排名广州有哪些建筑公司
  • [教学资料] Web架构 | 前后端开发模式演进:从混合到分离的技术之路
  • IDEA2025无法更新使用Terminal控制台
  • LLaVA-OneVision论文阅读
  • CentOS 7.9安装OpenSSL 1.1.1w
  • JavaWeb后端实战(MySql基础)
  • 网站设计 三把火科技家装商城系统网站建设
  • 新书速览|AI摄影与创意设计:Stable Diffusion-ComfyUI
  • 网站源码是啥wordpress 移植
  • NLP-注意力机制