当前位置: 首页 > news >正文

深度学习在建筑物提取中的应用综述

深度学习在建筑物提取中的应用综述


目录

  • 深度学习在建筑物提取中的应用综述
    • @[toc](目录)
    • 深度学习在建筑物提取中的应用综述
      • 一、建筑物提取简介
      • 二、深度学习方法分类
        • 1. 语义分割(Semantic Segmentation)
        • 2. 实例分割(Instance Segmentation)
        • 3. 边界感知分割(Boundary-aware Segmentation)
        • 4. 多模态融合方法
      • 三、主流建筑物提取公开数据集及分析
      • 四、数据获取方式及注意事项
        • 1. 数据获取方式
        • 2. 数据使用注意事项
      • 五、模型对比分析(建筑物提取精度)
      • 六、相关竞赛推荐
      • 七、建筑物矢量化与后处理示例(从预测掩膜转矢量)
      • 八、遥感建筑物提取流程图(从影像下载到成果展示)
      • 九、使用GEE平台批量下载遥感影像与建筑标签
      • 十、QGIS/ArcGIS 联动深度学习成果方法

深度学习在建筑物提取中的应用综述

一、建筑物提取简介

建筑物提取(Building Extraction)是遥感图像分析中的关键任务,旨在从航空影像、卫星图像或激光雷达数据中自动识别并提取建筑物的边界或轮廓。它在城市规划、地图更新、灾害评估、智慧城市建设等方面具有重要意义。

二、深度学习方法分类

1. 语义分割(Semantic Segmentation)
  • 目标:对每一个像素进行分类,判断其是否属于建筑物类别。

  • 代表网络:U-Net, SegNet, DeepLabv3+, PSPNet

  • 特点

    • 优点:训练稳定、分割精度高
    • 缺点:无法区分相邻的多个建筑物,边界模糊时效果较差
      在这里插入图片描述
2. 实例分割(Instance Segmentation)
  • 目标:不仅识别每个像素属于建筑物,还区分每一个单独的建筑体。

  • 代表网络:Mask R-CNN, PANet, Cascade Mask R-CNN

  • 特点

    • 优点:适用于建筑密集区,便于统计和矢量化
    • 缺点:对训练数据要求更高,推理速度较慢
      在这里插入图片描述
3. 边界感知分割(Boundary-aware Segmentation)
  • 目标:强调建筑物轮廓清晰度,提高边缘精度。

  • 代表方法:HRNet, Gated-SCNN, BDCN

  • 特点

    • 优点:边界处理更细腻
    • 缺点:对标签质量要求高
      在这里插入图片描述
4. 多模态融合方法
  • 结合数据源:光学影像 + SAR + LiDAR
  • 优势:提高抗遮挡能力,增强建筑物立体识别能力

三、主流建筑物提取公开数据集及分析

数据集名称类型分辨率标签类型区域优点缺点获取方式
SpaceNet语义/实例~0.3m多边形+栅格拉斯维加斯、巴黎等高质量影像+矢量数据,任务分明城市样本偏欧美,分割标签不完全一致官网
Inria Aerial语义0.3m二值掩膜奥地利、美国等城市标签精确,图像质量高覆盖城市少,缺少多样性Inria官方
WHU Building语义/实例0.075m栅格+矢量中国武汉分辨率极高,适合中国案例研究主要是单一城市,泛化有限官网
Massachusetts语义1m栅格掩膜波士顿易于入门、样本清晰图像模糊、标签粗糙Kaggle
DOTA实例0.1-0.5m旋转框多国机场、港口等多目标检测,建筑物种类丰富标签复杂,非全覆盖官网
Google Open Buildings实例(矢量)不等GeoJSON矢量非洲、亚洲部分地区全球大范围建筑轮廓高度信息缺失,影像源不公开Google官网
OpenStreetMap (OSM)矢量-building标签全球社区贡献,持续更新数据完整性、精度不一Overpass API

四、数据获取方式及注意事项

1. 数据获取方式
  • 官方网站直接下载(如 SpaceNet、Inria、WHU)
  • GitHub 资源库(如 WHU、Massachusetts)
  • 使用Overpass API或Pyrosm从OSM提取矢量数据
  • Google Earth Engine:加载Open Buildings或影像数据
  • 自制数据集:配合人工标注工具如LabelMe、VIA构建
2. 数据使用注意事项
  • 许可协议:检查是否允许商用、是否需署名(如CC-BY、MIT)
  • 数据预处理:需裁剪、归一化、重投影(统一坐标系如WGS84)
  • 标签质量:注意矢量标签是否闭合、是否与影像匹配
  • 区域适应性:国外数据集模型迁移到国内需fine-tuning
  • 格式兼容性:常用格式如GeoTIFF、Shapefile、PNG、GeoJSON

五、模型对比分析(建筑物提取精度)

模型方法类别优点缺点平均IoU
U-Net语义分割快速训练,结构简单边界不清晰0.78
DeepLabv3+语义分割多尺度感受野,精度高推理较慢0.82
Mask R-CNN实例分割建筑物区分明显占用内存高0.85
HRNet + Edge Loss边界增强边界锐利训练不稳定0.84
Swin-UnetTransformer长距离依赖,表现好参数量大0.86

六、相关竞赛推荐

比赛名称主办链接
中国软件杯建筑识别挑战赛工信部/高校联盟https://www.cnsoftbei.com
阿里天池遥感图像分割挑战赛阿里云天池平台https://tianchi.aliyun.com
IEEE GRSS Data Fusion ContestIEEE遥感学会https://www.grss-ieee.org/community/technical-committees/data-fusion
百度AI Studio - 遥感地物分类竞赛百度AI平台https://aistudio.baidu.com
华为昇腾遥感建筑检测挑战赛华为云昇腾平台https://developer.huawei.com

七、建筑物矢量化与后处理示例(从预测掩膜转矢量)

import cv2
import numpy as np
import geopandas as gpd
from shapely.geometry import Polygon
from osgeo import osr# 将二值掩膜转换为多边形
def mask_to_polygons(binary_mask, transform):contours, _ = cv2.findContours(binary_mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)polygons = []for cnt in contours:coords = [transform(pt[0][0], pt[0][1]) for pt in cnt]poly = Polygon(coords)if poly.is_valid:polygons.append(poly)return gpd.GeoDataFrame(geometry=polygons, crs="EPSG:4326")

说明:transform 是像素坐标到地理坐标的转换函数。最终可保存为 GeoJSONShapefile 用于 GIS 分析。


八、遥感建筑物提取流程图(从影像下载到成果展示)

  1. 数据准备

    • 下载遥感影像(Sentinel-2、Google Maps、GF-2等)
    • 下载或制作标签(矢量或栅格)
  2. 数据预处理

    • 裁剪/拼接影像
    • 格式转换(GeoTIFF → PNG)
    • 标签矢量转掩膜(如使用 rasterio.mask
  3. 模型训练与预测

    • 构建训练集、验证集
    • 选择分割模型(U-Net、DeepLabv3+、Swin-Unet等)
    • 训练并保存模型
  4. 结果后处理

    • 二值化预测图 → 膨胀/腐蚀优化边界
    • 矢量化 → shapefile/GeoJSON导出
  5. 成果展示与应用

    • 在QGIS/ArcGIS中叠加查看
    • 输入到城市规划系统或灾害应急平台中

九、使用GEE平台批量下载遥感影像与建筑标签

// GEE 示例代码:下载带建筑标签的影像
var roi = ee.Geometry.Rectangle([117.1, 36.6, 117.2, 36.7]);var image = ee.ImageCollection('COPERNICUS/S2').filterBounds(roi).filterDate('2022-01-01', '2022-01-31').sort('CLOUD_COVER').first().clip(roi);Export.image.toDrive({image: image.select(['B4','B3','B2']),description: 'sentinel_rgb',scale: 10,region: roi
});

说明:可进一步结合 Google Open Buildings 数据集下载 GeoJSON 建筑标签。


十、QGIS/ArcGIS 联动深度学习成果方法

- QGIS方式:

  • 安装插件【Semi-Automatic Classification Plugin】或【Deep Learning Tool】
  • 导入预测栅格图(掩膜图),使用 raster to vector 工具转换
  • 叠加原始影像并进行属性计算,如面积、高度估计等

- ArcGIS方式:

  • 使用 ArcGIS Pro 3.x 的【Image Analyst】模块
  • 导入模型(Esri支持ONNX、TorchScript)
  • 使用“深度学习分类工具箱”直接预测栅格或矢量
  • 转为 shapefile,并可加入属性字段进行空间统计

本综述系统梳理了深度学习在遥感影像建筑物提取中的主流方法,重点比较语义分割与实例分割的特点与适用场景。结合SpaceNet、WHU、Inria等多个公开数据集,从标签类型、分辨率、区域覆盖等角度评估其优缺点及获取方式。进一步总结常见模型表现,补充数据预处理、格式转换与注意事项。文中还介绍了从遥感影像下载到成果展示的完整流程,包括Google Earth Engine批量下载、QGIS/ArcGIS联动深度学习成果方法,以及建筑物矢量化处理示例,最后推荐多个遥感相关竞赛与实践路径,为研究与应用提供系统参考。

如果有下载数据的需要可以后台私信。

相关文章:

  • 2025年5月26日工作总结
  • 从“黑箱”到透明化:MES如何重构生产执行全流程?
  • 亚当·斯密思想精髓的数学建模与形式化表征
  • 鸿蒙OSUniApp 开发的多图浏览器组件#三方框架 #Uniapp
  • HOW - 从0到1搭建自己的博客站点(一)
  • OpenPCDet安装排错
  • 解锁MCP:AI大模型的万能工具箱
  • 如何学习联邦学习和差分隐私
  • 深度体验:海螺 AI,开启智能创作新时代
  • 高速通信时代的信号编码利器-PAM4技术解析
  • 工作计划工作总结年终总结PPT模版分享
  • 商务风企业公司推广培训计划PPT模版分享
  • 液体散货装卸管理人员备考指南
  • 为什么需要清除浮动?清除浮动的方式有哪些?
  • 文档工具解析:前端如何选择最适合的文档生成器?
  • 油烟净化设备清洗周期的科学确定依据
  • 网络编程——UDP网络编程
  • CQF预备知识:Python相关库 -- NumPy 基础知识 - 使用 genfromtxt 导入数据
  • 《算法笔记》13.2小节——专题扩展->树状数组(BIT) 问题 D: 数列-训练套题T10T3
  • 16QAM通信系统设计与实现(上篇)——信号生成与调制技术(python版本)
  • 深圳苏州企业网站建设服务/互联网项目推广
  • 如何在网上建立自己的网站/b站24小时自助下单平台网站
  • 四川住房和城乡建设厅官方网站/微信营销的成功案例
  • 赣榆网站建设/常熟seo关键词优化公司
  • 怎么做祝福的网站/外贸网络营销
  • 做网站那种语言好/关键词查询网址