当前位置：首页 > news >正文

深度学习在建筑物提取中的应用综述

news 2025/11/7 3:17:28

深度学习在建筑物提取中的应用综述

目录

深度学习在建筑物提取中的应用综述
@[toc](目录)
深度学习在建筑物提取中的应用综述
一、建筑物提取简介
二、深度学习方法分类
1. 语义分割（Semantic Segmentation）
2. 实例分割（Instance Segmentation）
3. 边界感知分割（Boundary-aware Segmentation）
4. 多模态融合方法

三、主流建筑物提取公开数据集及分析
四、数据获取方式及注意事项
1. 数据获取方式
2. 数据使用注意事项

五、模型对比分析（建筑物提取精度）
六、相关竞赛推荐
七、建筑物矢量化与后处理示例（从预测掩膜转矢量）
八、遥感建筑物提取流程图（从影像下载到成果展示）
九、使用GEE平台批量下载遥感影像与建筑标签
十、QGIS/ArcGIS 联动深度学习成果方法

深度学习在建筑物提取中的应用综述

一、建筑物提取简介

建筑物提取（Building Extraction）是遥感图像分析中的关键任务，旨在从航空影像、卫星图像或激光雷达数据中自动识别并提取建筑物的边界或轮廓。它在城市规划、地图更新、灾害评估、智慧城市建设等方面具有重要意义。

二、深度学习方法分类

1. 语义分割（Semantic Segmentation）

目标：对每一个像素进行分类，判断其是否属于建筑物类别。
代表网络：U-Net, SegNet, DeepLabv3+, PSPNet
特点：
- 优点：训练稳定、分割精度高
- 缺点：无法区分相邻的多个建筑物，边界模糊时效果较差

2. 实例分割（Instance Segmentation）

目标：不仅识别每个像素属于建筑物，还区分每一个单独的建筑体。
代表网络：Mask R-CNN, PANet, Cascade Mask R-CNN
特点：
- 优点：适用于建筑密集区，便于统计和矢量化
- 缺点：对训练数据要求更高，推理速度较慢

3. 边界感知分割（Boundary-aware Segmentation）

目标：强调建筑物轮廓清晰度，提高边缘精度。
代表方法：HRNet, Gated-SCNN, BDCN
特点：
- 优点：边界处理更细腻
- 缺点：对标签质量要求高

4. 多模态融合方法

结合数据源：光学影像 + SAR + LiDAR
优势：提高抗遮挡能力，增强建筑物立体识别能力

三、主流建筑物提取公开数据集及分析

数据集名称	类型	分辨率	标签类型	区域	优点	缺点	获取方式
SpaceNet	语义/实例	~0.3m	多边形+栅格	拉斯维加斯、巴黎等	高质量影像+矢量数据，任务分明	城市样本偏欧美，分割标签不完全一致	官网
Inria Aerial	语义	0.3m	二值掩膜	奥地利、美国等城市	标签精确，图像质量高	覆盖城市少，缺少多样性	Inria官方
WHU Building	语义/实例	0.075m	栅格+矢量	中国武汉	分辨率极高，适合中国案例研究	主要是单一城市，泛化有限	官网
Massachusetts	语义	1m	栅格掩膜	波士顿	易于入门、样本清晰	图像模糊、标签粗糙	Kaggle
DOTA	实例	0.1-0.5m	旋转框	多国机场、港口等	多目标检测，建筑物种类丰富	标签复杂，非全覆盖	官网
Google Open Buildings	实例（矢量）	不等	GeoJSON矢量	非洲、亚洲部分地区	全球大范围建筑轮廓	高度信息缺失，影像源不公开	Google官网
OpenStreetMap (OSM)	矢量	-	building标签	全球	社区贡献，持续更新	数据完整性、精度不一	Overpass API

四、数据获取方式及注意事项

1. 数据获取方式

官方网站直接下载（如 SpaceNet、Inria、WHU）
GitHub 资源库（如 WHU、Massachusetts）
使用Overpass API或Pyrosm从OSM提取矢量数据
Google Earth Engine：加载Open Buildings或影像数据
自制数据集：配合人工标注工具如LabelMe、VIA构建

2. 数据使用注意事项

许可协议：检查是否允许商用、是否需署名（如CC-BY、MIT）
数据预处理：需裁剪、归一化、重投影（统一坐标系如WGS84）
标签质量：注意矢量标签是否闭合、是否与影像匹配
区域适应性：国外数据集模型迁移到国内需fine-tuning
格式兼容性：常用格式如GeoTIFF、Shapefile、PNG、GeoJSON

五、模型对比分析（建筑物提取精度）

模型	方法类别	优点	缺点	平均IoU
U-Net	语义分割	快速训练，结构简单	边界不清晰	0.78
DeepLabv3+	语义分割	多尺度感受野，精度高	推理较慢	0.82
Mask R-CNN	实例分割	建筑物区分明显	占用内存高	0.85
HRNet + Edge Loss	边界增强	边界锐利	训练不稳定	0.84
Swin-Unet	Transformer	长距离依赖，表现好	参数量大	0.86

六、相关竞赛推荐

比赛名称	主办	链接
中国软件杯建筑识别挑战赛	工信部/高校联盟	https://www.cnsoftbei.com
阿里天池遥感图像分割挑战赛	阿里云天池平台	https://tianchi.aliyun.com
IEEE GRSS Data Fusion Contest	IEEE遥感学会	https://www.grss-ieee.org/community/technical-committees/data-fusion
百度AI Studio - 遥感地物分类竞赛	百度AI平台	https://aistudio.baidu.com
华为昇腾遥感建筑检测挑战赛	华为云昇腾平台	https://developer.huawei.com

七、建筑物矢量化与后处理示例（从预测掩膜转矢量）

import cv2
import numpy as np
import geopandas as gpd
from shapely.geometry import Polygon
from osgeo import osr# 将二值掩膜转换为多边形
def mask_to_polygons(binary_mask, transform):contours, _ = cv2.findContours(binary_mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)polygons = []for cnt in contours:coords = [transform(pt[0][0], pt[0][1]) for pt in cnt]poly = Polygon(coords)if poly.is_valid:polygons.append(poly)return gpd.GeoDataFrame(geometry=polygons, crs="EPSG:4326")

说明：transform 是像素坐标到地理坐标的转换函数。最终可保存为 GeoJSON 或 Shapefile 用于 GIS 分析。

八、遥感建筑物提取流程图（从影像下载到成果展示）

数据准备
- 下载遥感影像（Sentinel-2、Google Maps、GF-2等）
- 下载或制作标签（矢量或栅格）
数据预处理
- 裁剪/拼接影像
- 格式转换（GeoTIFF → PNG）
- 标签矢量转掩膜（如使用 rasterio.mask）
模型训练与预测
- 构建训练集、验证集
- 选择分割模型（U-Net、DeepLabv3+、Swin-Unet等）
- 训练并保存模型
结果后处理
- 二值化预测图 → 膨胀/腐蚀优化边界
- 矢量化 → shapefile/GeoJSON导出
成果展示与应用
- 在QGIS/ArcGIS中叠加查看
- 输入到城市规划系统或灾害应急平台中

九、使用GEE平台批量下载遥感影像与建筑标签

// GEE 示例代码：下载带建筑标签的影像
var roi = ee.Geometry.Rectangle([117.1, 36.6, 117.2, 36.7]);var image = ee.ImageCollection('COPERNICUS/S2').filterBounds(roi).filterDate('2022-01-01', '2022-01-31').sort('CLOUD_COVER').first().clip(roi);Export.image.toDrive({image: image.select(['B4','B3','B2']),description: 'sentinel_rgb',scale: 10,region: roi
});

说明：可进一步结合 Google Open Buildings 数据集下载 GeoJSON 建筑标签。

十、QGIS/ArcGIS 联动深度学习成果方法

- QGIS方式：

安装插件【Semi-Automatic Classification Plugin】或【Deep Learning Tool】
导入预测栅格图（掩膜图），使用 raster to vector 工具转换
叠加原始影像并进行属性计算，如面积、高度估计等

- ArcGIS方式：

使用 ArcGIS Pro 3.x 的【Image Analyst】模块
导入模型（Esri支持ONNX、TorchScript）
使用“深度学习分类工具箱”直接预测栅格或矢量
转为 shapefile，并可加入属性字段进行空间统计

本综述系统梳理了深度学习在遥感影像建筑物提取中的主流方法，重点比较语义分割与实例分割的特点与适用场景。结合SpaceNet、WHU、Inria等多个公开数据集，从标签类型、分辨率、区域覆盖等角度评估其优缺点及获取方式。进一步总结常见模型表现，补充数据预处理、格式转换与注意事项。文中还介绍了从遥感影像下载到成果展示的完整流程，包括Google Earth Engine批量下载、QGIS/ArcGIS联动深度学习成果方法，以及建筑物矢量化处理示例，最后推荐多个遥感相关竞赛与实践路径，为研究与应用提供系统参考。