基于 GEE 利用 Sentinel-2 数据结合线性回归模型实现碳储量反演
目录
1 原理与方法
1.1 技术背景
1.2 技术方案
1.2.1 数据预处理:提升数据质量
1.2.2 预测因子构建:整合有效特征
1.2.3 鲁棒线性回归:抗干扰的模型选择
1.2.4 精度验证:用 RMSE 评估模型性能
1.3 使用的数据集
2 代码解析
2.1 基础设置
2.2 碳储量基准数据加载
2.3 Sentinel-2 数据处理
2.4 Dynamic World 树木掩膜构建
2.5 预测因子构建
2.6 鲁棒线性回归模型训练
2.7 碳储量预测与后处理
2.8 可视化设置(论文级标准)
2.9 精度验证(RMSE 计算)
2.10 结果导出
3 完整代码
4 运行结果
5 总结
1 原理与方法
1.1 技术背景
植被碳储量(尤其是森林碳储量)与植被的生物量直接相关,而生物量又可通过遥感影像的光谱特征间接反映:叶片的叶绿素含量、细胞结构会影响可见光 - 近红外波段的反射率(如近红外波段反射率随生物量增加而升高),植被指数(如 NDVI)则能直接量化植被生长状况。因此,通过光谱特征与碳储量的统计关系,可反演大范围碳储量分布。

1.2 技术方案
本方案的核心是 “用 Sentinel-2 光谱特征预测碳储量”,流程可概括为 “数据预处理→预测因子构建→模型训练→精度验证”。

1.2.1 数据预处理:提升数据质量
- Sentinel-2 处理:筛选云量 <10% 的影像后做 “中值合成”(median ())—— 中值能有效过滤单景影像的云、阴影等噪声;通过 multiply (0.0001) 将原始 DN 值转换为 0 - 1 的实际反射率。
- NDVI 计算:用 normalizedDifference (['B8','B4']) 计算 (近红外 - 红)/(近红外 + 红),NDVI 与植被生物量高度相关,作为重要辅助特征。
1.2.2 预测因子构建:整合有效特征
预测因子是模型的 “输入特征”,需包含与碳储量相关的所有参数:
- 常数项:线性回归模型的截距项,确保模型能拟合基线值;
- Sentinel-2 光谱波段:B1 - B12 共 12 个波段,反映植被光谱细节;
- NDVI:量化植被生长状况的综合指数;
- 树木掩膜:通过 updateMask (dw) 仅保留树木区域(非树木区域设为无效值),确保模型聚焦于 “有碳储量的核心区域”。
1.2.3 鲁棒线性回归:抗干扰的模型选择
为什么选鲁棒线性回归?
普通线性回归对异常值(如因云影导致的低反射率、采样误差导致的高碳储量值)敏感,会拉偏回归系数;而鲁棒线性回归通过降低异常值的权重,减少其对模型的影响,更适合遥感数据的噪声特性。
模型训练时,用 ee.Reducer.robustLinearRegression (14, 1)—— 参数 "14" 是自变量数量(1 个常数项 + 12 个光谱波段 + 1 个 NDVI),"1" 是因变量(碳储量),通过 reduceRegion 在研究区范围内计算回归系数。
1.2.4 精度验证:用 RMSE 评估模型性能
用均方根误差(RMSE)验证预测结果与基准碳储量的差异:
1.3 使用的数据集
数据集名称 | 数据源 ID | 时间范围 | 选择波段 | 数据说明 |
---|---|---|---|---|
WCMC 碳储量数据集 | WCMC/biomass_carbon_density/v1_0 | 无特定时间范围 | carbon_tonnes_per_ha | 提供生物量碳密度数据,用于碳储量基准值获取,单位为 tC/ha |
Sentinel-2 数据集 | COPERNICUS/S2_SR_HARMONIZED | 2020-2021 | B.*(所有以 B 开头的光谱波段) | 哨兵 2 号地表反射率数据,经大气校正,用于提取光谱特征和计算植被指数 |
Dynamic World 数据集 |