【数据集】中国多属性建筑数据集CMAB
目录
- 数据概述-CMAB
- 📐 包含的建筑属性(七类)
- 📦 数据来源与方法
- 🧠 建模方法与流程
- 1️⃣ 数据预处理与空间采样
- 2️⃣ 几何属性提取
- 3️⃣ 指示属性提取
- 4️⃣ 模型验证
- 📊 精度评估结果
- 🛰️ 与其他数据集对比优势
- 数据下载
- 参考
数据概述-CMAB
论文-J2025-CMAB: A Multi-Attribute Building Dataset of China
CMAB:中国多属性建筑数据集(China Multi-Attribute Building dataset, CMAB)
项目 | 内容 |
---|---|
数据名称 | CMAB(China Multi-Attribute Building) |
发布年份 | 2025年 |
空间覆盖 | 中国大陆全部地区(共3,667个空间城市) |
建筑数量 | 超过 31,000,000 个单体建筑 |
屋顶面积总量 | 236 亿平方米 |
建筑体量 | 3,630 亿立方米 |
属性种类 | 7类建筑属性(详见下文) |
数据格式 | GIS格式(矢量Polygon,WGS1984 坐标系) |
存储空间 | 272 GB |
下载地址 | Figshare 数据库 |
📐 包含的建筑属性(七类)
类型 | 属性 | 描述 |
---|---|---|
✅ 几何属性 | 屋顶形状(rooftop) | 屋顶轮廓(矢量polygon) |
✅ 几何属性 | 建筑高度(height) | 单体建筑的垂直高度(米) |
✅ 指示属性 | 建筑功能(function) | 居住、办公、商服、工业等功能分类(30类,后重分类) |
✅ 指示属性 | 建筑结构(structure) | 框架结构、砖混、钢结构等 |
✅ 指示属性 | 建筑风格(style) | 不同建筑风格(现代、中式、欧式等) |
✅ 指示属性 | 建筑年代(age) | 建造年份,1985–2018共35类 |
✅ 指示属性 | 建筑质量(quality) | 外立面维护状况、是否违建等 |
📦 数据来源与方法
🔍 多源数据融合(multi-source data)
数据类型 | 来源 | 分辨率 / 数量 |
---|---|---|
高分遥感图像 | Google Earth (0.3–1m) | 5亿幅,总计20 TB |
街景图像(SVI) | 百度地图(2014–2023) | 6千万幅,总计14 TB |
建筑高度 | 百度地图(2023) | 约1,700万条矢量数据 |
建筑功能 | 百度AOI(2023) | 830万地块功能数据 |
建筑风格/质量 | SVIs + Yolov8/CLIP模型 | 识别6类建筑质量问题 |
建筑年代 | GAIA不透水面数据(1985–2018) | 推断建造年份 |
补充数据 | POI、道路、行政区划、气候区划等 |
百度建筑数据集的处理如下:
🧠 建模方法与流程
1️⃣ 数据预处理与空间采样
采用“空间城市”(Spatial Cities)概念,定义城市边界(共3,667个城市)
排除农村和非建成区,提升模型效率
2️⃣ 几何属性提取
使用 OCRNet 提取屋顶轮廓(F1-score = 89.93%)
高度建模采用 Bootstrap-XGBoost 方法,融合:
- 屋顶形态
- 街道邻近度
- 城市等级
- 建筑块状特征
3️⃣ 指示属性提取
功能识别:结合 AOI 功能 + POI + 建筑形态特征(91个变量)
质量识别:Yolov8 检测 6 类建筑外观问题(如破损、杂乱、违建)
年代识别:GAIA 数据判断不透水面首次出现年份
风格/结构识别:使用 CLIP 多模态模型识别建筑风格
4️⃣ 模型验证
使用手工标注数据(2,500 个建筑样本)进行验证
高度、功能、质量、年代等属性分别对比百度数据/SVI等
📊 精度评估结果
属性 | 方法 | 精度指标 |
---|---|---|
屋顶提取 | OCRNet | mIoU = 81.95%, F1 = 89.93%, Acc = 91.59% |
建筑高度 | XGBoost(多模型) | R² = 0.84(非城市区)– 0.68(直辖市);RMSE < 8m |
建筑功能 | XGBoost + AOI | 准确率 88%,住宅类 F1 ≈ 0.90,商服类略低(≈0.5–0.7) |
建筑质量 | Yolov8 + SVI | 平均准确率约 82%(6个质量维度) |
建筑年代 | GAIA + Anjuke验证 | 82% 分类准确率,平均误差约 8.7 年 |
🛰️ 与其他数据集对比优势
数据集 | 覆盖范围 | 属性 | 分辨率 | 公开性 |
---|---|---|---|---|
GABLE | 全国 | 屋顶+高度 | 2.5m | ❌ |
3D-GloBFP | 全球 | 高度 | 不详 | ❌ |
East Asia | Buildings | 东亚 | 屋顶 1m | ❌ |
CMAB(本研究) | 全国 | 屋顶、高度、功能、风格、结构、年代、质量 | 0.3–1m | ✅ 开源(Figshare) |
数据下载
数据下载- Figshare 数据库
数据格式:GIS标准格式(Shapefile / GeoJSON)
坐标系:WGS1984
示例字段:building_id、rooftop_geometry、height、function、style、age、quality 等
可根据需要下载对应城市,以重庆市为例,在GIS中多属性建筑数据特征如下: