当前位置: 首页 > news >正文

机器学习 vs. 动力学模型,Ai2 最新研究:仅需 2 分钟,ACE2 可完成一次 4 个月季节预报

从农田灌溉规划到寒潮灾害防控,季节尺度天气预报是防灾减灾、农业生产与能源调度的关键支撑。长期以来,这类预报依赖基于物理方程的动力模式,而随着 AI 发展,机器学习模型在关键指标上已媲美传统模型,部分场景精度更优。

机器学习模型的核心优势是「自回归预报」: 模拟大气 1-6 小时短期演变,将预报结果反馈模型以生成多日高精度预报,部分模型可精准预报数周,还能借大规模集合预报提升极端天气概率预测能力。但瓶颈明显:预报超数周易出现稳定性减弱、细节丢失,难满足季节尺度需求;且模型物理机制解释难、季节预报样本少(每年仅 1 个独立样本),用物理模式模拟数据扩充训练集又会继承误差。

正是在这样的技术背景下,由英国埃克塞特哈德利中心气象局、埃克塞特大学以及美国艾伦人工智能研究所(Ai2)共同组成的研究团队,对此前开发的机器学习天气模型 ACE2 进行了评估,并与动力模式 GloSea 对比。 结果显示,ACE2 无需复杂海气耦合,仅通过 ERA5 历史数据学习大气演变,就能在长期自回归预报中保持稳定,初步具备季节预报潜力。该研究首次证实,机器学习模型可生成高技巧全球季节预测,为短期气候预报技术发展提供新方向。

相关研究成果以「Skilful global seasonal predictions from a machine learning weather model trained on reanalysis data」为题,发表于 npj Climate and Atmospheric Science。

在这里插入图片描述

论文地址:

https://go.hyper.ai/YyRfT

关注公众号,后台回复「ACE2」获取完整 PDF

更多 AI 前沿论文:

https://hyper.ai/papers

数据集:季节预报模型评估的多源数据整合

该研究整合多源数据支撑季节预报模型评估,核心数据来源与处理方式如下:

历史大气基础数据取自 ERA5 再分析数据集, 为确保整个预报期内海表温度(SST)与海冰状态的稳定性,研究基于 6 小时分辨率的大气原始数据,对每个网格单元施加标准差为 10 天的高斯滚动平均滤波处理,以构建兼具季节变化特征与边界条件稳定性的气候背景场;

月降水量观测数据则来源于全球降水气候学计划(GPCP)v2.3 数据集, 为后续降水预报结果的验证提供观测基准。

用于对比的传统动力模式数据,取自 GloSea 业务化集合预报系统(配置为 GC3.2),采用该系统 1993–2015 年间逐年初始化的后报数据。该系统包含 63 个集合成员,分三批初始化(每年 10 月 25 日、11 月 1 日、11 月 9 日各 21 个成员),集合离散度通过随机物理方案生成;其模拟预报时长为 6 个月,大气分辨率约 0.5°、海洋分辨率 0.25°,大气部分设 85 个垂直层次(延伸至平流层 85 千米高度),海洋部分设 75 个垂直层次,在热带与中纬度地区的次季节至季节尺度预报中表现优异,是当前该领域的先进动力模式代表。

为统一预报结果的比较基准,该研究所有 ERA5 再分析数据与 GloSea 模式数据均通过双线性插值,转换至 ACE2 的原生 1°×1° 网格,仅降水数据插值至 2.5°×2.5° 网格。 为精准量化关键气候信号,研究对核心气候指数的定义与验证方法进行了明确界定:ENSO 事件依据 12 月-次年 2 月(DJF)海洋尼诺指数(ONI)判定,阈值设为 ±0.5K,确定了 8 个厄尔尼诺冬季和 9 个拉尼娜冬季。NAO 指数定义为南北区域(20°N-55°N 与 55°N-90°N)间的平均海平面气压差。

在集合成员筛选与预报性能评估环节,该研究选取特定初始化时间窗口的成员以保证可比性:ACE2 取 10 月 28 日-11 月 1 日初始化成员(n=20),GloSea 取 11 月 1 日初始化成员(n=21)。NAO 值整合为 5 天气候平均值并去除气候平均态。研究计算了集合平均误差(RMSEₚ)和离散度(基于 σᵢₚ),并通过可预报成分比(RPC)从信号与噪声角度评估性能,显著性采用随机重采样方法检验。

ACE2 模型的季节预报实现:数据驱动与物理约束相结合

该研究采用的 ACE2 机器学习大气模型,以「数据驱动与物理约束相结合」为核心设计理念。 该模型仅基于 ERA5 再分析大气场进行训练,能够以 1° 网格分辨率对每 6 小时大气状态演变作出准确预测,并在长期自回归预报中保持良好稳定性。这一性能得益于三项关键设计:采用球面傅里叶神经算子(Spherical Fourier Neural Operator)架构,有效捕捉球面空间中的大气演变规律;支持用户自定义海洋与海冰边界条件,适应多样化预报场景;对质量守恒、水汽循环、降水率及辐射通量等关键物理过程施加约束,确保预报结果符合物理一致性。

在季节尺度预报中,ACE2 采用滞后集合方法生成预报结果。 在 1993–2015 年期间,模型自每年 10 月 25 日至 11 月 9 日每 6 小时初始化一个集合成员,全年共生成 64 个成员。所有初始化场均来源于 ERA5 再分析数据,以保证初始状态真实性。预报从初始化时刻持续至次年 3 月中旬,对应 1–3 个月的预报时效。

在边界条件处理上,ACE2 采用持续的海表温度(SST)和海冰异常数据, 基于初始化时刻各网格单元的瞬时异常,结合由 ERA5 数据推导的 6 小时分辨率气候态,在整个预报期内固定该异常值。该策略与训练阶段采用的时变边界条件不同,有助于减少季节预报中边界波动带来的干扰。气候态基于 1994–2016 年共 23 年 ERA5 数据,经标准差为 10 天的高斯滤波平滑后得到。任意网格在时刻 t 的 SST 边界由公式计算,海冰浓度采用相同处理方式,且结果严格限定于 0–1 合理区间。

此外,大气顶向下短波辐射通量及全球平均 CO₂ 浓度参考传统动力模式 GloSea 的设置,以保证对比时边界条件一致。ACE2 对这两类边界条件的敏感程度尚待进一步研究。

为评估边界条件敏感性,研究通过多组对照实验验证:使用 1988–2022 年数据推导气候态时,NAO 相关系数为 0.54;采用前一年短波辐射通量时,NAO 为 0.43;使用前一年 CO₂ 数据时,NAO 为 0.38。这些结果与「自然变率测试」(natural variability test)(初始化时刻推迟 6 小时,NAO 相关系数为 0.42)一致,表明在当前季节预报任务中,ACE2 对上述边界条件变化不敏感,体现出良好的预报稳定性。

ACE2 仅基于 6 小时观测演变过程训练,仍能展现出优异的预报技巧

多项研究证实,机器学习不仅推动了短期天气预报的技术革新,更为短期气候预测(季节尺度)的发展开辟了新路径。

在 1993–2015 年共 23 年的评估期内,如下图所示,ACE2 模型在 1–3 个月时效的季节预报中,展现出与传统动力模式 GloSea 高度相似的技巧分布特征,尤其在平均海平面气压(MSLP)预报上表现突出。值得关注的是,ACE2 的核心设计目标是实现稳定的气候模拟,并未针对季节预报能力进行专门优化,因此这种跨场景的性能一致性更具参考价值;与 GloSea 类似,ACE2 在欧洲地区的 MSLP 预报技巧相对较低,这一现象也反映出该区域气候变率复杂、预报难度大的共性挑战。

在这里插入图片描述

ACE2 和 GloSea 从 1993/1994 年至 2015/2016 年的平均海平面气压评分

从定量指标看,ACE2 在多数区域的相关系数略低于 GloSea。在温度预报方面,如下图所示,ACE2 仍保持大范围的有效预报能力,覆盖南美洲、非洲、澳大利亚及北美洲部分区域,其技巧分布规律与 MSLP 预报高度一致:北半球温带地区 ACE2 的面积加权平均相关系数为 0.41(GloSea 为 0.45),热带地区则为 0.68 与 0.77。

在这里插入图片描述

ACE2 和 GloSea 从 1993/1994 年至 2015/2016 年的地表温度评分

而在降水预报上,两类模型的整体技巧均相对较低,如下图所示,ACE2 的技巧空间分布与 GloSea仍呈现显著一致性,尤其在热带、加勒比海及东亚地区的吻合度更高,这一结果进一步证实 ACE2 具备对全球多区域季节变率的预报能力。

在这里插入图片描述

ACE2 和 GloSea 从 1993/1994 年至 2015/2016 年的降水量评分

两类模型在 NAO 预报中还表现出显著的互补性。 ACE2 与 GloSea 的 NAO 预报相关系数仅为 0.34(p=0.11),但将两者结果进行集合平均后,相关系数提升至 0.65(p<0.01),精度可与 GloSea 采用 127 个成员的扩展集合相媲美。从集合离散度与平均误差的演变趋势来看,如下图所示,两者也呈现高度一致性,进一步印证了 ACE2 集合预报的合理性。

在这里插入图片描述

对冬季 DJF 平均北大西洋涛动(NAO)的预测

在关键气候模态捕捉上,ACE2 对厄尔尼诺-南方涛动(ENSO)遥相关的模拟能力同样突出。如下图所示,通过对比厄尔尼诺年与拉尼娜年的气候场合成差值可见,ACE2 在 MSLP 与表面温度两个关键变量上展现的遥相关型,与 ERA5 再分析数据及 GloSea 模拟结果高度吻合,**证实即便仅通过大气 6 小时演变过程训练,ACE2 仍能精准识别全球多区域与 ENSO 相关的年际变率信号。 **

在这里插入图片描述

DJF 影响 ENSO 的表面条件

不过,ACE2 在 2009/2010 年极端冬季预报中显露出局限性:其集合平均未准确再现 MSLP 的负 NAO 型异常,仅模拟出北极气压略高于均值;平流层极涡模拟接近气候平均水平,而 ERA5 与 GloSea 均显示极涡显著减弱。SSW 预报上,GloSea 捕捉到 ENSO 与东风型 QBO 对 SSW 概率的增强效应,ACE2 仅 39% 成员出现平流层东风,与 40% 的气候发生率无差异;且其模拟的 SSW 概率在厄尔尼诺年(45%)、拉尼娜年(36%)与中性年(41%)间无统计差异,表明尚未充分捕捉 ENSO 与平流层的遥相关联系。

在这里插入图片描述

与 2009/2010 年极端冬季相关的地面和平流层异常

机器学习模型的显著优势还体现在计算效率上。ACE2 在单张英伟达 A100 GPU 上完成一次 4 个月的季节预报仅需不到 2 分钟, 而传统动力模式单次模拟需在超级计算机上运行数小时。这种效率优势为季节预报的技术创新提供了更多可能。

综上,ACE2 的系列预报结果充分证明,机器学习方法不仅适用于短期天气预报,更能为短期气候预测的技术突破与业务化应用提供新路径,为应对全球气候变化背景下的气候风险预警提供了重要技术支撑。

全球学术产业协同,AI 重塑气象预报

近年来,人工智能技术的迅猛发展正深刻改变气象预报领域,尤其在季节与气候预测方面展现出显著潜力,高校与科研机构在理论创新方面持续突破。例如,美国麻省理工学院(MIT)开发的 CERA 机器学习框架,为全球变暖背景下的气候预测提供了新路径。 该框架不依赖高温室气体情境下的标记数据,而是结合受控气候数据与未标记的暖气候输入,有效提升模型在未知气候状态下的泛化能力。CERA 不仅能够捕捉关键气候要素如湿气输送和能量循环的变化趋势,还能还原水汽的垂直结构与经向分布特征,并在极端降水的概率预报方面表现出较高准确性。

企业界则更注重推动技术落地与效率提升,致力于将机器学习模型集成至实际业务系统中。谷歌 DeepMind 开发的 GraphCast 模型,基于图神经网络实现了全球 10 天天气预报的分钟级生成, 其多项预报指标已超越欧洲中期天气预报中心(ECMWF)的传统数值模式,为灾害应急响应提供重要支撑。

英伟达则联合美国国家海洋和大气管理局(NOAA)等机构推出 FourCastNet, 依托傅里叶神经算子实现高分辨率全球建模,对极端天气的预测时效较传统方法提前 12–24 小时,为防灾减灾争取了更多应对时间。

展望未来,随着跨学科合作的不断深入、高质量多源气象数据集的完善,以及「物理约束+数据驱动」混合建模框架的持续演进,机器学习有望成为下一代气候预报系统的关键核心,为应对气候变化、保障农业生产和增强防灾能力提供更可靠的科学支撑。

参考链接:
1.https://mp.weixin.qq.com/s/Q5zJUwpeT88DvojgAA1afA
2.https://mp.weixin.qq.com/s/ZqlLWpoDSdFo82Qw44Sb3A

http://www.dtcms.com/a/395808.html

相关文章:

  • RNN循环神经网络详解
  • 【Nginx开荒攻略】深入解析Nginx进程管理与信号控制:从原理到实战
  • MySQL与Redis面试问题详解
  • 鸿蒙Next IPC Kit详解:构建高效进程间通信的完整指南
  • 【开题答辩全过程】以 基于springboot的高校疫情防控系统为例,包含答辩的问题和答案
  • Centos7 命令行使用nmcli重置网络配置
  • 如何计算sequence粒度的负载均衡损失
  • 学财税大数据应用,需要考CPA/税务师吗?
  • RAG全栈技术——文档加载器
  • 如何理解Service Mesh(服务网格)
  • android9适配camera gc02m1
  • 【十天成长计划】BoostKit初级班 开班啦!——陪伴式学习,阶梯式成长
  • 【图文详解】强化学习核心框架、数学基础、分类、应用场景
  • Rust简介
  • golang和rust内存分配策略
  • 简历项目之无人机图像目标识别
  • pantherx2 armbian librga-rockchip librga.so 编译安装方法
  • 【精品资料鉴赏】189页工程车辆集团数字化转型SAP解决方案
  • 算法 --- 多源 BFS
  • 15.Linux 硬盘分区管理
  • 2.UE-准备环境(二)-下载虚幻引擎源码和搞成vs项目并使用vs打开
  • G-Star公益行获评CCF优秀技术公益案例,用开源技术传递善意
  • 文化赋能・创意西宁 西宁传媒行业创业发展沙龙成功举办 探索本土企业升级新路径
  • TDengine 与 MYSQL 的差异总结
  • Mysql杂志(二十一)——Hash索引和二叉搜索树、AVL树
  • 什么是类的实例化
  • 西门子 S7-200 SMART PLC 实操案例:中断程序的灵活应用定时中断实现模拟量滤波(下)
  • STM32FreeRtos入门(二)——创建第一个多任务程序
  • Qt QML and Qt Quick 简述及例程
  • Linux 系统移植