深度学习在建筑物提取中的应用综述
深度学习在建筑物提取中的应用综述
目录
- 深度学习在建筑物提取中的应用综述
- @[toc](目录)
- 深度学习在建筑物提取中的应用综述
- 一、建筑物提取简介
- 二、深度学习方法分类
- 1. 语义分割(Semantic Segmentation)
- 2. 实例分割(Instance Segmentation)
- 3. 边界感知分割(Boundary-aware Segmentation)
- 4. 多模态融合方法
- 三、主流建筑物提取公开数据集及分析
- 四、数据获取方式及注意事项
- 1. 数据获取方式
- 2. 数据使用注意事项
- 五、模型对比分析(建筑物提取精度)
- 六、相关竞赛推荐
- 七、建筑物矢量化与后处理示例(从预测掩膜转矢量)
- 八、遥感建筑物提取流程图(从影像下载到成果展示)
- 九、使用GEE平台批量下载遥感影像与建筑标签
- 十、QGIS/ArcGIS 联动深度学习成果方法
目录
- 深度学习在建筑物提取中的应用综述
- @[toc](目录)
- 深度学习在建筑物提取中的应用综述
- 一、建筑物提取简介
- 二、深度学习方法分类
- 1. 语义分割(Semantic Segmentation)
- 2. 实例分割(Instance Segmentation)
- 3. 边界感知分割(Boundary-aware Segmentation)
- 4. 多模态融合方法
- 三、主流建筑物提取公开数据集及分析
- 四、数据获取方式及注意事项
- 1. 数据获取方式
- 2. 数据使用注意事项
- 五、模型对比分析(建筑物提取精度)
- 六、相关竞赛推荐
- 七、建筑物矢量化与后处理示例(从预测掩膜转矢量)
- 八、遥感建筑物提取流程图(从影像下载到成果展示)
- 九、使用GEE平台批量下载遥感影像与建筑标签
- 十、QGIS/ArcGIS 联动深度学习成果方法
深度学习在建筑物提取中的应用综述
一、建筑物提取简介
建筑物提取(Building Extraction)是遥感图像分析中的关键任务,旨在从航空影像、卫星图像或激光雷达数据中自动识别并提取建筑物的边界或轮廓。它在城市规划、地图更新、灾害评估、智慧城市建设等方面具有重要意义。
二、深度学习方法分类
1. 语义分割(Semantic Segmentation)
-
目标:对每一个像素进行分类,判断其是否属于建筑物类别。
-
代表网络:U-Net, SegNet, DeepLabv3+, PSPNet
-
特点:
- 优点:训练稳定、分割精度高
- 缺点:无法区分相邻的多个建筑物,边界模糊时效果较差
2. 实例分割(Instance Segmentation)
-
目标:不仅识别每个像素属于建筑物,还区分每一个单独的建筑体。
-
代表网络:Mask R-CNN, PANet, Cascade Mask R-CNN
-
特点:
- 优点:适用于建筑密集区,便于统计和矢量化
- 缺点:对训练数据要求更高,推理速度较慢
3. 边界感知分割(Boundary-aware Segmentation)
-
目标:强调建筑物轮廓清晰度,提高边缘精度。
-
代表方法:HRNet, Gated-SCNN, BDCN
-
特点:
- 优点:边界处理更细腻
- 缺点:对标签质量要求高
4. 多模态融合方法
- 结合数据源:光学影像 + SAR + LiDAR
- 优势:提高抗遮挡能力,增强建筑物立体识别能力
三、主流建筑物提取公开数据集及分析
数据集名称 | 类型 | 分辨率 | 标签类型 | 区域 | 优点 | 缺点 | 获取方式 |
---|---|---|---|---|---|---|---|
SpaceNet | 语义/实例 | ~0.3m | 多边形+栅格 | 拉斯维加斯、巴黎等 | 高质量影像+矢量数据,任务分明 | 城市样本偏欧美,分割标签不完全一致 | 官网 |
Inria Aerial | 语义 | 0.3m | 二值掩膜 | 奥地利、美国等城市 | 标签精确,图像质量高 | 覆盖城市少,缺少多样性 | Inria官方 |
WHU Building | 语义/实例 | 0.075m | 栅格+矢量 | 中国武汉 | 分辨率极高,适合中国案例研究 | 主要是单一城市,泛化有限 | 官网 |
Massachusetts | 语义 | 1m | 栅格掩膜 | 波士顿 | 易于入门、样本清晰 | 图像模糊、标签粗糙 | Kaggle |
DOTA | 实例 | 0.1-0.5m | 旋转框 | 多国机场、港口等 | 多目标检测,建筑物种类丰富 | 标签复杂,非全覆盖 | 官网 |
Google Open Buildings | 实例(矢量) | 不等 | GeoJSON矢量 | 非洲、亚洲部分地区 | 全球大范围建筑轮廓 | 高度信息缺失,影像源不公开 | Google官网 |
OpenStreetMap (OSM) | 矢量 | - | building标签 | 全球 | 社区贡献,持续更新 | 数据完整性、精度不一 | Overpass API |
四、数据获取方式及注意事项
1. 数据获取方式
- 官方网站直接下载(如 SpaceNet、Inria、WHU)
- GitHub 资源库(如 WHU、Massachusetts)
- 使用Overpass API或Pyrosm从OSM提取矢量数据
- Google Earth Engine:加载Open Buildings或影像数据
- 自制数据集:配合人工标注工具如LabelMe、VIA构建
2. 数据使用注意事项
- 许可协议:检查是否允许商用、是否需署名(如CC-BY、MIT)
- 数据预处理:需裁剪、归一化、重投影(统一坐标系如WGS84)
- 标签质量:注意矢量标签是否闭合、是否与影像匹配
- 区域适应性:国外数据集模型迁移到国内需fine-tuning
- 格式兼容性:常用格式如GeoTIFF、Shapefile、PNG、GeoJSON
五、模型对比分析(建筑物提取精度)
模型 | 方法类别 | 优点 | 缺点 | 平均IoU |
---|---|---|---|---|
U-Net | 语义分割 | 快速训练,结构简单 | 边界不清晰 | 0.78 |
DeepLabv3+ | 语义分割 | 多尺度感受野,精度高 | 推理较慢 | 0.82 |
Mask R-CNN | 实例分割 | 建筑物区分明显 | 占用内存高 | 0.85 |
HRNet + Edge Loss | 边界增强 | 边界锐利 | 训练不稳定 | 0.84 |
Swin-Unet | Transformer | 长距离依赖,表现好 | 参数量大 | 0.86 |
六、相关竞赛推荐
比赛名称 | 主办 | 链接 |
---|---|---|
中国软件杯建筑识别挑战赛 | 工信部/高校联盟 | https://www.cnsoftbei.com |
阿里天池遥感图像分割挑战赛 | 阿里云天池平台 | https://tianchi.aliyun.com |
IEEE GRSS Data Fusion Contest | IEEE遥感学会 | https://www.grss-ieee.org/community/technical-committees/data-fusion |
百度AI Studio - 遥感地物分类竞赛 | 百度AI平台 | https://aistudio.baidu.com |
华为昇腾遥感建筑检测挑战赛 | 华为云昇腾平台 | https://developer.huawei.com |
七、建筑物矢量化与后处理示例(从预测掩膜转矢量)
import cv2
import numpy as np
import geopandas as gpd
from shapely.geometry import Polygon
from osgeo import osr# 将二值掩膜转换为多边形
def mask_to_polygons(binary_mask, transform):contours, _ = cv2.findContours(binary_mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)polygons = []for cnt in contours:coords = [transform(pt[0][0], pt[0][1]) for pt in cnt]poly = Polygon(coords)if poly.is_valid:polygons.append(poly)return gpd.GeoDataFrame(geometry=polygons, crs="EPSG:4326")
说明:transform
是像素坐标到地理坐标的转换函数。最终可保存为 GeoJSON
或 Shapefile
用于 GIS 分析。
八、遥感建筑物提取流程图(从影像下载到成果展示)
-
数据准备
- 下载遥感影像(Sentinel-2、Google Maps、GF-2等)
- 下载或制作标签(矢量或栅格)
-
数据预处理
- 裁剪/拼接影像
- 格式转换(GeoTIFF → PNG)
- 标签矢量转掩膜(如使用
rasterio.mask
)
-
模型训练与预测
- 构建训练集、验证集
- 选择分割模型(U-Net、DeepLabv3+、Swin-Unet等)
- 训练并保存模型
-
结果后处理
- 二值化预测图 → 膨胀/腐蚀优化边界
- 矢量化 → shapefile/GeoJSON导出
-
成果展示与应用
- 在QGIS/ArcGIS中叠加查看
- 输入到城市规划系统或灾害应急平台中
九、使用GEE平台批量下载遥感影像与建筑标签
// GEE 示例代码:下载带建筑标签的影像
var roi = ee.Geometry.Rectangle([117.1, 36.6, 117.2, 36.7]);var image = ee.ImageCollection('COPERNICUS/S2').filterBounds(roi).filterDate('2022-01-01', '2022-01-31').sort('CLOUD_COVER').first().clip(roi);Export.image.toDrive({image: image.select(['B4','B3','B2']),description: 'sentinel_rgb',scale: 10,region: roi
});
说明:可进一步结合 Google Open Buildings 数据集下载 GeoJSON 建筑标签。
十、QGIS/ArcGIS 联动深度学习成果方法
- QGIS方式:
- 安装插件【Semi-Automatic Classification Plugin】或【Deep Learning Tool】
- 导入预测栅格图(掩膜图),使用 raster to vector 工具转换
- 叠加原始影像并进行属性计算,如面积、高度估计等
- ArcGIS方式:
- 使用 ArcGIS Pro 3.x 的【Image Analyst】模块
- 导入模型(Esri支持ONNX、TorchScript)
- 使用“深度学习分类工具箱”直接预测栅格或矢量
- 转为 shapefile,并可加入属性字段进行空间统计
本综述系统梳理了深度学习在遥感影像建筑物提取中的主流方法,重点比较语义分割与实例分割的特点与适用场景。结合SpaceNet、WHU、Inria等多个公开数据集,从标签类型、分辨率、区域覆盖等角度评估其优缺点及获取方式。进一步总结常见模型表现,补充数据预处理、格式转换与注意事项。文中还介绍了从遥感影像下载到成果展示的完整流程,包括Google Earth Engine批量下载、QGIS/ArcGIS联动深度学习成果方法,以及建筑物矢量化处理示例,最后推荐多个遥感相关竞赛与实践路径,为研究与应用提供系统参考。
如果有下载数据的需要可以后台私信。