AI重构完整的地球系统模型
ECMWF & DestinE 计划深度解析
过去两年,数据驱动的 AI 天气大模型彻底颠覆了传统气象预报的格局。
但对于深刻理解地球系统运行规律的从业者而言,单靠模拟大气层显然是不够的。
海洋温度引导着风暴的轨迹,土壤水分调节着地表与大气之间的热量交换,海冰的演变直接牵动着极地甚至全球的气候系统。
真正的数字地球,必须是一个多圈层耦合的复杂巨系统。
近期,欧洲中期天气预报中心(ECMWF)在欧盟“目标地球”(DestinE)计划下披露了极为详尽的技术细节。
在成功将其业务化 AI 天气预报系统(AIFS)推向日常运营后,他们正全面跨越纯大气的边界,利用深度学习重构陆地、水文、海浪、海冰以及三维海洋等核心圈层。
△ 构建数据驱动的地球系统模型
异构数据与底层框架演进
走出大气层,意味着 AI 模型将面临截然不同的物理和数据挑战。
不同圈层的观测覆盖率和数据质量参差不齐,且时间尺度差异巨大——大气的变化通常是瞬态的,而海洋和陆地过程往往具有极长的“记忆效应”。
为了支撑庞杂的数据处理,研究团队联合欧洲多个气象机构,基于开源的anemoi生态系统构建了完整的机器学习流水线。
在数据的选择上,各个组件量体裁衣:
陆地和海浪组件主要依托合成模型运行和定制的回报数据;
水文组件高度依赖观测数据集;
而海冰和海洋组件则深度汲取了 ECMWF 最先进的 ORAS6 海洋再分析产品。
△ 各类地球系统组件训练数据集规模与来源
从陆地掩码到水文汇流
在最复杂的陆地表面过程建模中,地表对大气强迫的响应(如土壤水分、积雪覆盖等)被高度关注。由于陆面过程具有很强的局部和“垂直列”特征,模型架构巧妙选用了多层感知机(MLPs)。
同时,由于陆地模型在海洋区域存在大量“缺失数据”,工程上采用了一种创新的掩码(Mask)策略:在训练期间屏蔽输入场中的缺失值以防数值崩溃,模型在全域生成预测后,再通过相关变量的掩码在损失计算中剔除无效区域。
△ anemoi 掩码处理机制说明(蓝色为掩码值)
当视线转向水平维度的水文汇流时,网格化数据的局限性便显露无疑——自然界的流域边界从不完美契合规则的经纬度。为此,技术团队利用 earthkit-hydro 工具包执行了基于物理流域的空间聚合,并选用长短期记忆网络(LSTM)来契合河流网络的定向流动与时间记忆效应。
冰冻圈、深邃海洋与耦合蓝图
海洋与冰冻圈的建模同样充满硬核的物理考量。
海浪组件将具有循环属性的波浪方向转化为连续的余弦和正弦分量;海冰模型则在后处理中引入了严格的物理一致性约束,例如让海冰浓度硬性约束冰速等变量。
而在更深邃的三维海洋建模中,模型需要同时刻画短期的大气-海洋表面交换和长期的深海混合效应。
为此,海洋组件保留了 AIFS 核心的编码器-处理器-解码器架构,并探索了定制化的注意力(Attention)机制,以极大地提升局部海洋动态特征的表征能力。
△ 不同地球系统组件的模型架构与注意力机制差异
目前,这些地球系统组件已经可以作为独立的机器学习模型,在大气输出的强迫下运行。这不仅方便了结合物理领域知识进行针对性调优,更为最终的全面耦合奠定了基础。
随着 AIFS 系统不断引入陆面、海浪、海冰等特征场,一个完全由数据驱动、全要素耦合的下一代地球系统预测模型,其轮廓已经愈发清晰。这标志着我们将以更低的计算代价,获取物理一致性更强、时空分辨率更高的多圈层数据底座。
比较遗憾的是,ECMWF Destination Earth 项目下的 “ML Earth System Components”(机器学习地球系统组件)目前大部分仍处于原型(prototype)阶段,具体模型权重和完整实现大多尚未完全开源。
欢迎交流
笔者长期从事人工智能、遥感、大模型等业务
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……




还没有评论,来说两句吧...