【3D算法技术入门】如何基于建筑图片重建三维数字资产?
要基于建筑图片重建三维数字资产是一个复杂的计算机视觉任务,涉及图像采集、特征提取、相机姿态估计、稠密重建和三维模型优化等多个步骤。下面我将提供一个基于Python的解决方案框架,使用开源库实现从图片到三维模型的基本流程。
首先需要安装必要的库:
pip install opencv-python numpy matplotlib pycolmap trimesh open3d
下面是实现的核心代码,包含了从图像加载、特征匹配到三维点云生成的完整流程:
import os
import cv2
import numpy as np
import matplotlib.pyplot as plt
import trimesh
import open3d as o3d
from pycolmap import Reconstruction, Image, Point3D# 1. 准备工作:设置路径和参数
class BuildingReconstructor:def __init__(self, image_dir, output_dir):self.image_dir = image_dirself.output_dir = output_dirself.image_paths = [os.path.join(image_dir, f) for f in os.listdir(image_dir) if f.lower().endswith(('.png', '.jpg', '.jpeg'))]self.reconstruction = None# 创建输出目录os.makedirs(output_dir, exist_ok=True)os.makedirs(os.path.join(output_dir, 'sparse'), exist_ok=True)os.makedirs(os.path.join(output_dir, 'dense'), exist_ok=True)# 2. 图像预处理def preprocess_images(self):"""对图像进行预处理,包括 resize 和去畸变"""processed_dir = os.path.join(self.output_dir, 'processed_images')os.makedirs(processed_dir, exist_ok=True)processed_paths = []for img_path in self.image_paths:img = cv2.imread(img_path)# 调整图像大小,保持比例h, w = img.shape[:2]max_dim = 1024if max(h, w) > max_dim:scale = max_dim / max(h, w)img = cv2.resize(img, (int(w*scale), int(h*scale)))# 保存处理后的图像filename = os.path.basename(img_path)save_path = os.path.join(processed_dir, filename)cv2.imwrite(save_path, img)processed_paths.append(save_path)self.image_paths = processed_pathsprint(f"预处理完成,共 {len(processed_paths)} 张图片")return processed_paths# 3. 特征提取与匹配(使用COLMAP进行稀疏重建)def run_sparse_reconstruction(self):"""使用COLMAP进行稀疏重建,获取相机参数和稀疏点云"""print("开始稀疏重建...")# 调用COLMAP进行特征提取和匹配from pycolmap import feature_extractor, exhaustive_matcher, mapper# 特征提取feature_extractor(database_path=os.path.join(self.output_dir, 'database.db'),image_path=self.image_dir,image_list=self.image_paths,camera_mode=0 # 自动选择相机模型)# 特征匹配exhaustive_matcher(database_path=os.path.join(self.output_dir, 'database.db'))# 三维重建self.reconstruction = mapper(database_path=os.path.join(self.output_dir, 'database.db'),image_path=self.image_dir,output_path=os.path.join(self.output_dir, 'sparse'),verbose=True)print(f"稀疏重建完成,生成 {len(self.reconstruction.points3D)} 个三维点")return self.reconstruction# 4. 稠密重建(生成密集点云)def run_dense_reconstruction(self):"""基于稀疏重建结果进行稠密重建"""if not self.reconstruction:raise ValueError("请先进行稀疏重建")print("开始稠密重建...")# 这里简化实现,实际项目中可以使用OpenMVS或COLMAP的稠密重建模块# 导出稀疏点云points = []colors = []for p3d in self.reconstruction.points3D.values():points.append(p3d.xyz)colors.append(p3d.color / 255.0)# 转换为Open3D点云pcd = o3d.geometry.PointCloud()pcd.points = o3d.utility.Vector3dVector(np.array(points))pcd.colors = o3d.utility.Vector3dVector(np.array(colors))# 点云下采样和去噪pcd = pcd.voxel_down_sample(voxel_size=0.05)cl, ind = pcd.remove_statistical_outlier(nb_neighbors=20, std_ratio=2.0)pcd = pcd.select_by_index(ind)# 保存稠密点云dense_pcd_path = os.path.join(self.output_dir, 'dense', 'point_cloud.ply')o3d.io.write_point_cloud(dense_pcd_path, pcd)print(f"稠密点云保存至 {dense_pcd_path},包含 {len(pcd.points)} 个点")return pcd# 5. 三维模型生成(从点云创建网格)def generate_mesh(self, pcd):"""从点云生成三维网格模型"""print("开始生成三维网格...")# 估计法向量pcd.estimate_normals(search_param=o3d.geometry.KDTreeSearchParamHybrid(radius=0.1, max_nn=30))# 使用泊松表面重建生成网格with o3d.utility.VerbosityContextManager(o3d.utility.VerbosityLevel.Debug) as cm:mesh, densities = o3d.geometry.TriangleMesh.create_from_point_cloud_poisson(pcd, depth=9)# 裁剪低密度区域vertices_to_keep = densities > np.quantile(densities, 0.01)mesh = mesh.select_by_index(np.where(vertices_to_keep)[0])# 保存网格模型mesh_path = os.path.join(self.output_dir, 'building_mesh.ply')o3d.io.write_triangle_mesh(mesh_path, mesh)print(f"三维网格模型保存至 {mesh_path}")return mesh# 6. 可视化结果def visualize_results(self, pcd=None, mesh=None):"""可视化点云和网格模型"""if pcd:print("可视化点云...")o3d.visualization.draw_geometries([pcd], window_name="建筑点云")if mesh:print("可视化网格模型...")o3d.visualization.draw_geometries([mesh], window_name="建筑三维模型")# 执行完整流程def run_pipeline(self):"""执行完整的三维重建流程"""self.preprocess_images()self.run_sparse_reconstruction()pcd = self.run_dense_reconstruction()mesh = self.generate_mesh(pcd)self.visualize_results(pcd, mesh)return mesh# 主函数
def main():# 设置图片目录和输出目录image_dir = "building_images" # 存放从小红书收集的建筑图片output_dir = "reconstruction_results"# 确保图片目录存在if not os.path.exists(image_dir) or len(os.listdir(image_dir)) == 0:print(f"错误:图片目录 {image_dir} 不存在或为空")print("请先在该目录下放置建筑的多角度图片")return# 创建重建器并运行reconstructor = BuildingReconstructor(image_dir, output_dir)mesh = reconstructor.run_pipeline()print("三维重建流程完成!")if __name__ == "__main__":main()
使用说明
这个代码实现了从建筑图片到三维模型的完整流程,主要分为以下几个步骤:
-
数据准备:
- 在"building_images"文件夹中放入从小红书收集的建筑图片
- 建议收集15-30张不同角度、不同光照条件下的图片,覆盖建筑各个面
-
代码运行:
- 运行脚本后,程序会自动进行图像预处理
- 接着进行特征提取和匹配,构建稀疏点云
- 然后生成稠密点云并构建三维网格模型
- 最后可视化结果并保存模型文件
-
结果输出:
- 处理后的图片
- 稀疏点云和稠密点云数据
- 最终的三维网格模型(PLY格式),可导入Blender等软件进一步编辑
注意事项
- 图片质量对重建结果影响很大,建议使用清晰、光照均匀的图片
- 拍摄时尽量围绕建筑移动,保持重叠区域,避免剧烈视角变化
- 对于复杂建筑,可能需要更多图片和后期手动优化
- 该代码需要安装COLMAP软件,具体安装方法请参考官方文档
- 从网络获取图片时请注意遵守版权规定和平台条款
如果需要更高质量的重建结果,可以考虑使用专业的三维重建软件如Agisoft Metashape,或在这个基础上增加纹理映射、模型简化等步骤。