当前位置: 首页 > news >正文

【数据集】中国多属性建筑数据集CMAB

目录

  • 数据概述-CMAB
    • 📐 包含的建筑属性(七类)
    • 📦 数据来源与方法
    • 🧠 建模方法与流程
      • 1️⃣ 数据预处理与空间采样
      • 2️⃣ 几何属性提取
      • 3️⃣ 指示属性提取
      • 4️⃣ 模型验证
    • 📊 精度评估结果
    • 🛰️ 与其他数据集对比优势
  • 数据下载
  • 参考

数据概述-CMAB

论文-J2025-CMAB: A Multi-Attribute Building Dataset of China

CMAB:中国多属性建筑数据集(China Multi-Attribute Building dataset, CMAB)

项目内容
数据名称CMAB(China Multi-Attribute Building)
发布年份2025年
空间覆盖中国大陆全部地区(共3,667个空间城市)
建筑数量超过 31,000,000 个单体建筑
屋顶面积总量236 亿平方米
建筑体量3,630 亿立方米
属性种类7类建筑属性(详见下文)
数据格式GIS格式(矢量Polygon,WGS1984 坐标系)
存储空间272 GB
下载地址Figshare 数据库

📐 包含的建筑属性(七类)

类型属性描述
✅ 几何属性屋顶形状(rooftop)屋顶轮廓(矢量polygon)
✅ 几何属性建筑高度(height)单体建筑的垂直高度(米)
✅ 指示属性建筑功能(function)居住、办公、商服、工业等功能分类(30类,后重分类)
✅ 指示属性建筑结构(structure)框架结构、砖混、钢结构等
✅ 指示属性建筑风格(style)不同建筑风格(现代、中式、欧式等)
✅ 指示属性建筑年代(age)建造年份,1985–2018共35类
✅ 指示属性建筑质量(quality)外立面维护状况、是否违建等

在这里插入图片描述

📦 数据来源与方法

🔍 多源数据融合(multi-source data)

数据类型来源分辨率 / 数量
高分遥感图像Google Earth (0.3–1m)5亿幅,总计20 TB
街景图像(SVI)百度地图(2014–2023)6千万幅,总计14 TB
建筑高度百度地图(2023)约1,700万条矢量数据
建筑功能百度AOI(2023)830万地块功能数据
建筑风格/质量SVIs + Yolov8/CLIP模型识别6类建筑质量问题
建筑年代GAIA不透水面数据(1985–2018)推断建造年份
补充数据POI、道路、行政区划、气候区划等

在这里插入图片描述

百度建筑数据集的处理如下:
在这里插入图片描述

🧠 建模方法与流程

在这里插入图片描述

1️⃣ 数据预处理与空间采样

采用“空间城市”(Spatial Cities)概念,定义城市边界(共3,667个城市)
排除农村和非建成区,提升模型效率

2️⃣ 几何属性提取

使用 OCRNet 提取屋顶轮廓(F1-score = 89.93%)
高度建模采用 Bootstrap-XGBoost 方法,融合:

  • 屋顶形态
  • 街道邻近度
  • 城市等级
  • 建筑块状特征

在这里插入图片描述

3️⃣ 指示属性提取

功能识别:结合 AOI 功能 + POI + 建筑形态特征(91个变量)

质量识别:Yolov8 检测 6 类建筑外观问题(如破损、杂乱、违建)
在这里插入图片描述

年代识别:GAIA 数据判断不透水面首次出现年份
在这里插入图片描述

风格/结构识别:使用 CLIP 多模态模型识别建筑风格

4️⃣ 模型验证

使用手工标注数据(2,500 个建筑样本)进行验证
高度、功能、质量、年代等属性分别对比百度数据/SVI等

📊 精度评估结果

属性方法精度指标
屋顶提取OCRNetmIoU = 81.95%, F1 = 89.93%, Acc = 91.59%
建筑高度XGBoost(多模型)R² = 0.84(非城市区)– 0.68(直辖市);RMSE < 8m
建筑功能XGBoost + AOI准确率 88%,住宅类 F1 ≈ 0.90,商服类略低(≈0.5–0.7)
建筑质量Yolov8 + SVI平均准确率约 82%(6个质量维度)
建筑年代GAIA + Anjuke验证82% 分类准确率,平均误差约 8.7 年

在这里插入图片描述

🛰️ 与其他数据集对比优势

在这里插入图片描述

数据集覆盖范围属性分辨率公开性
GABLE全国屋顶+高度2.5m
3D-GloBFP全球高度不详
East AsiaBuildings东亚屋顶 1m
CMAB(本研究)全国屋顶、高度、功能、风格、结构、年代、质量0.3–1m✅ 开源(Figshare)

在这里插入图片描述

数据下载

数据下载- Figshare 数据库
在这里插入图片描述

数据格式:GIS标准格式(Shapefile / GeoJSON)
坐标系:WGS1984
示例字段:building_id、rooftop_geometry、height、function、style、age、quality 等

可根据需要下载对应城市,以重庆市为例,在GIS中多属性建筑数据特征如下:
在这里插入图片描述

参考

相关文章:

  • springboot中各模块间实现bean之间互相调用(service以及自定义的bean)
  • C# 曲线编写总览
  • (17) 关于工具箱 QToolBox 的一个简单的范例使用,以了解其用法
  • 快速解决Linux 中yum镜像拉取失败问题
  • 从协议壁垒到无缝协同:Profibus转Profinet网关的智造赋能逻辑
  • Oracle基础知识(四)
  • 力扣HOT100之回溯:46. 全排列
  • 大数据治理:理论、实践与未来展望(一)
  • ROS云课三分钟-破壁篇GCompris-一小部分支持Edu应用列表-2025
  • 第一课如何学习课程
  • Dify源码学习
  • csp备考Day1|string和vector
  • 几个MySQL系统调优工具
  • 03-工具篇-SSH远程登录ubuntu系统
  • Kubernetes in action-机理
  • 【Web前端】jQuery入门与基础(一)
  • ISO 26262-5 评估硬件随机失效率
  • Linux—进程池实现
  • C++题解(33)2025年顺德区中小学生程序设计展示活动(初中组C++)U560876 美丽数(一)和 U560878 美丽数(二)题解
  • Python之两个爬虫案例实战(澎湃新闻+网易每日简报):附源码+解释
  • 东莞住建局投诉电话是多少/百度上如何做优化网站
  • 网站备案的流程/西安seo推广公司
  • 奶茶加盟网站建设公司哪家好/seo门户网站优化
  • 上海企业模板建站/考研培训
  • 网上做视频赚钱的网站有哪些/百度网站制作
  • 高校网站建设近期情况说明/网站搜索优化官网