【数据集】中国大陆城市建筑楼面面积高分辨率数据集(2017年)
目录
- 数据概述
- 🧾 数据来源与处理流程
- 🧠 建模方法与流程
- 🧾 衍生指标:容积率(Floor Area Ratio, FAR)
- 数据下载
- ⚠️ 局限性与注意事项
- 参考
数据概述
论文-J2021-High-resolution mapping of mainland China’s urban floor area
📌 数据集基本信息
属性 | 内容 |
---|---|
时间 | 2017年(建筑物数据),2018年(夜间灯光) |
空间分辨率 | 130 米(最终楼面面积图) |
空间覆盖 | 中国大陆范围(不含港澳台) |
数据格式 | 栅格(Raster)数据,单位为 m² |
研究方法 | 随机森林回归(Random Forest)建模 |
主要数据源 | LUOJIA 1-01夜间灯光影像、人口数据、单体建筑数据(71城市) |
总体精度 | R² = 0.68,RMSE = 7277.46 m²/公顷 |
🧾 数据来源与处理流程
1、🌃 夜间灯光影像(LUOJIA 1-01)
新一代高分辨率夜间灯光卫星,分辨率为 130m
数据时间:2018年6月至12月
来源:http://www.hbeos.org.cn
利用 VANUI 指数(利用 NDVI 校正灯光饱和)提升建筑识别效果
2、🏢 单体建筑数据(Single Building Dataset)
来源:百度地图服务(www.map.baidu.com)
包含71个城市的单体建筑矢量图层及其楼层数
通过建筑投影面积 × 楼层数计算楼面面积
采用 130m 鱼网栅格聚合至栅格图(避免重复计算)
3、👥 人口分布数据(Population Map)
分辨率:100m(重采样至130m)
来源:Ye et al., 2019,基于POI、DMSP/OLS、NDVI、DEM、道路、普查数据等
4、🗺️ 城市边界掩膜(Urban Area Mask)
来源:Liu et al., 2018,基于 Landsat 和 GEE 生成的30m城市土地利用图
用于限定城市范围,减少误识别
🧠 建模方法与流程
步骤 | 描述 |
---|---|
数据集划分 | 50 个城市用于训练,21 个城市用于验证精度 |
模型方法 | 使用 随机森林回归模型(RF) |
自变量 | LUOJIA 1-01 灯光值 + 人口密度 |
因变量 | 71城市的楼面面积(楼层 × 建筑面积)聚合所得栅格值 |
精度评估 | 使用 R² 和 RMSE 评估 CFA(计算楼面面积)与 PFA(预测楼面面积)一致性 |
🧾 衍生指标:容积率(Floor Area Ratio, FAR)
FAR = 楼面面积 / 土地面积(建筑密度的量化指标)
- FAR < 1:低密度建筑区(50.98%)
- FAR 1–2:多层建筑区(44.06%)
- FAR 2–3:高层混合区(4.54%)
- FAR > 3:高密度高层建筑区(0.42%,大多分布于一线城市)
数据下载
⚠️ 局限性与注意事项
限制 | 说明 |
---|---|
🧮 低值高估、高值低估 | 模型在低楼面密度区倾向高估,高密度区略有低估 |
🏙️ 城市尺度不适用 | 更适合大尺度(全国/区域)研究,不推荐用于单城市精细建模 |
📅 数据时效性 | 楼面面积为 2017年状态,不代表最新城市形态 |