DeepMind 开源大模型 GenCast 登 Nature:8 分钟预测 15 日天气

xxn 阅读:16825 2024-12-05 14:02:02 评论:0

DeepMind 大模型再度进入 Nature 杂志——

气象预测大模型 GenCast,在短短 8 分钟内完成对未来 15 天天气的预测,无论是普通天气还是极端天气的分析也能轻松胜任。

据报道,在 97.2% 的测试场景中,GenCast 的表现都明显优于全球领先的中期天气预报系统 ENS。

不同于之前推出的确定性预测 GraphCast,GenCast 更专注于各种天气情况的可能性。同时,类似于 GraphCast,GenCast 也已经被公开发布

GenCast 是基于扩散模型开发的,其分辨率达到了 0.25 度经度/纬度(约合赤道地区每个网格为 28×28 公里),将地球表面划分成超过 100 万个网格。

每个网格包含了 80 多个地表和大气变量,这意味着每次预测都会生成数千万甚至上亿的数据记录。

实验结果显示,在 1320 次测试中,GenCast 在 97.2% 的情况下比 ENS 预测更为准确。

DeepMind 的研究员 Ilan Price 对 GenCast 的表现表示:

我们取得了显著进展,通过机器学习跟上并超越了基于物理原理的模型。

超越传统方法的准确性

传统的天气预测使用数值天气预报(NWP)算法,其核心是对大气动力学方程的近似求解。

然而,与单一确定性预测相比,气象机构越来越倾向于采用集合预测方法,通过生成基于 NWP 的多个结果来模拟各种可能的气象情景。

GenCast 采用集合式预测,但其原理不同于 NWP,而是基于人工智能技术。

所谓 ENS,即欧洲中期天气预报中心(ECMWF)目前最先进的集合预报系统,未来将融入其确定性预报系统 HRES。

然而,即使是这个最强的传统方式也难以击败人工智能系统。

在日常预测中,DeepMind 团队设定了 1320 种实验条件,涉及不同的物理变量、预测时间和垂直高度,还特意使用历史数据(2019年)作为训练数据。

结果显示,GenCast 在 97.2% 的情况下比 ENS 更准确,而在预测未来 36 小时的情况下,GenCast 在 99.6% 的情况下胜出。

(CRPS 用于衡量预测与观测值之间累积概率分布的差异,数值越小表示预测越准确)

对于高温、大风等极端天气事件(实验中按发生概率分为 1%/0.1%/0.01% 三档),除了少数情况外,GenCast 的相对经济价值(REV)明显优于 ENS。

(2t 代表距离海平面 2 米高处的温度,10wind_speed 代表 10 米处的风速,msl 代表平均海平面气压,蓝线表示 GenCast)

除了基础预测,GenCast 在实际应用中也展现出更强的预测能力。

DeepMind 团队在一个区域性风力发电应用上进行了测试,利用全球发电站数据库中的 5344 个风电场位置和装机容量信息,通过插值获得各风电场位置的 10 米风速预测,并根据功率曲线将其转换为风力发电预测。

在 120 公里、240 公里和480 公里三种空间聚合尺度上,GenCast 的风力发电预测 CRPS 和 REV 在 7 天内均明显优于 ENS。

除了预测精准,GenCast 的预测速度也非常快,仅需大约 8 分钟即可完成一次 15 天的预测,而 ENS 则需要几个小时。

利用扩散模型进行天气预测

与去年在科学杂志上发表的 GraphCast(基于图神经网络 GNN)不同,GenCast 使用扩散模型实现。

它以最近的 X (t) 和前一个时间步的天气状态 X (t-1) 的残差 Z (t) 为采样条件,经过去噪处理得到预测结果,同时利用预测结果计算新的残差作为下一步输入,以实现更长时间范围的预测。

为了进行去噪处理,DeepMind 使用了 Transformer 技术。

Transformer 编码器将物理状态场从经纬度网格映射到一个六次细化的二十面体网格上。

随后,在 Transformer 的自注意力机制下,每个网格节点将关注其周围 32 个邻居节点,从而有效捕捉局部和中等尺度的天气特征。

最终,解码器将结果映射回原分辨率,得到去噪处理后的结果。

GenCast 使用了从 ERA5 再分析数据集中提取的 1979 年至 2018 年共 40 年的数据(间隔为 12 小时,分辨率为 0.25°)进行训练。

为了提高预训练效果,数据被降采样至 1° 分辨率,利用 5 次细化的二十面体网格进行学习。这一阶段耗时 200 万步,需在 32 个 TPUv5 实例上运行大约 3.5 天。

训练完毕后,采用原始的 0.25 度分辨率数据和 6 次细化的二十面体网格对模型进行高精度微调,共计 64000 步,约需 1.5 天完成。

目前,与去年发布的确定性预测模型 GraphCast 一样,GenCast 也已经开源,并公开了代码和模型权重。

DeepMind 还宣布将很快发布 GenCast 生成的实时和历史预测结果,为其他研究人员提供更多研究资源。

原文链接地址:

https://www.nature.com/articles/s41586-024-08252-9

参考链接:

  • [1]https://deepmind.google/discover/blog/gencast-predicts-weather-and-the-risks-of-extreme-conditions-with-sota-accuracy/

  • [2]https://www.nature.com/articles/d41586-024-03957-3

本文来源:量子位(ID:QbitAI),作者:克雷西,文题《DeepMind 大模型再度登上 Nature:8 分钟预测 15 日天气,准确度超过顶尖物理模型,已开源》

广告声明:文中包含外部链接供参考,旨在传达更多信息,节省甄选时间,仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容