写点什么

谷歌 MetNet:秒级别预测的神经网络天气模型

  • 2020-03-30
  • 本文字数:2677 字

    阅读完需:约 9 分钟

谷歌MetNet:秒级别预测的神经网络天气模型

准确预测从几分钟到几周后的天气是一项基础科学挑战,会对社会的许多领域产生广泛的影响。当下,许多气象机构采用的气象预报方法都是基于大气层的一些物理模型,尽管这些模型在过去的几十年中有了很大的改进,但它们的固有局限是需要庞大的算力,还需要对控制它们的物理定律有非常接近的估算结果。另一种天气预报方法能够克服其中一些限制,那就是使用深度神经网络(DNN)的方法:DNN 无需明确编码的物理定律,而是发现数据中的模式,并使用功能强大的专用硬件(例如 GPU 和 TPU)执行并行计算,来学习从输入到期望输出的复杂转换。


在我们之前对降水即时预报研究基础上,我们提出了“MetNet:用于降水预报的神经网络天气模型”,这是一种 DNN,能够以 2 分钟的间隔和 1km 的分辨率预测未来 8 小时内的降水概率。MetNet 优于NOAA当前使用的,基于物理定律的最先进模型,可以提供 7 到 8 小时的预测时间,并且可以预测美国全境内的天气,预测耗时只需几秒钟(之前的模型需要 1 小时)。该网络的输入自动从雷达站和卫星网络获取,无需人工注释。模型输出是一个概率分布,我们用它来推断每个地理区域最可能的降水概率以及相关的不确定性,下图提供了该网络在美国大陆上的预测示例。



MetNet 模型预测结果与由 NOAA 多雷达/多传感器系统(MRMS)测得的地面真值进行对比。MetNet 模型(顶部)显示了提前 2 分钟到 480 分钟预测的 1mm/hr 降水概率,而 MRMS 数据(底部)显示了在同一时间段内接收至少 1mm/hr 降水的区域。

神经网络天气模型

MetNet 不依赖描述大气动力学的明确物理定律,而是通过反向传播学习直接从观测数据中预测天气。该网络使用的降水量估算值是从多雷达或多传感器系统(MRMS)地面雷达站,以及来自 NOAA 的地球静止环境卫星系统的测量值得出的,后者提供了自上而下的大气层云图。两种数据源都覆盖了美国大陆,并提供了可通过网络有效处理的类似图像的输入。


该模型以 1km 分辨率,针对覆盖全美国的 64km 乘 64km 区域执行计算。但是,与这些输出区域相对应的输入数据,其实际物理覆盖范围要大得多,因为它必须考虑在预测的时间段内云层和降水场的可能运动。例如,假设云层以最高 60km/h 的速度运动,为了有效预测未来 8 小时内的大气层动态,该模型在所有方向上都需要 480km 的空间上下文数据。因此,要实现这样级别的数据覆盖,需要对 1024km 乘 1024km 区域的信息进行预测,才能得出中心 64km 乘 64km 区域的结果。



包含卫星和雷达图像的输入补丁的大小(大,1024 x 1024km),以及输出预测的雷达图像的大小(小,64 x 64km)


由于以全分辨率处理 1024km 乘 1024km 的区域需要大量内存,因此我们使用空间降采样器,它可以减小输入的空间尺寸以降低内存消耗,同时在输入中查找并保持相关的天气模式。然后,我们沿着降采样后的输入数据的时间维度应用时间编码器(由卷积 LSTM 实现,其非常适合图像序列),以 15 分钟为间隔对来自前 90 分钟输入数据的七个快照进行编码。接着将时间编码器的输出传递到一个空间聚合器,后者使用轴向自注意力来有效捕获数据中的远程空间相关性,并根据输入目标时间提供可变的上下文量,从而对 64km 乘 64km 区域输出预测。


该架构的输出是离散的概率分布,其估计了美国大陆上每平方公里的给定降水速率的概率。



神经网络气象模型 MetNet 的架构。输入的卫星和雷达图像首先通过空间降采样器以减少内存消耗。然后,90 分钟的输入数据以 15 分钟的间隔通过一个卷积 LSTM 来处理。接着使用轴向注意力层使网络看到输入图像整体。

结果

我们根据降水概率预报基准测试对 MetNet 进行评估,并将结果与​​两个基线进行了对比,分别是 NOAA 高分辨率快速刷新(HRRR,https://rapidrefresh.noaa.gov/hrrr/)系统(这是目前在美国运行的天气预报物理模型),以及一个用来估计降水区域动态(也就是光流)的基线模型,这是一种在预测时间少于 2 小时的情况下表现良好的方法。


我们的神经网络天气模型的一个显著优势是针对密集和并行计算进行了优化,非常适合在特殊硬件(例如 TPU)上运行。不管是针对特定位置(例如纽约市)还是针对整个美国,它都可以在几秒钟内并行输出预测结果,而诸如 HRRR 之类的物理模型在超级计算机上的计算时间约为一个小时。


我们在下图中量化了 MetNet、HRRR 和光流基线模型之间的性能差异。在这里,我们展示了使用F1分数,在 1.0mm/h 的降水率阈值下评估这三个模型实现的性能对比,该阈值对应的是小雨。MetNet 神经天气模型能够在 8 小时内的预测时间内胜过 NOAA HRRR 系统,并且始终优于基于流量的模型。



在 1.0mm/h 的降水速率下用 F1 分数评估性能(越高越好)。在 8 小时内的预测时间内,神经网络天气模型(MetNet)优于目前在美国运行的基于物理的模型(HRRR)。


由于大气的随机性,随着预测时间的延长,关于未来确切天气状况的不确定性会增加。因为 MetNet 是一个概率模型,所以随着预测时间的延长,可以在图像上看到预测结果的波动,也就是不确定性。相反,HRRR 并不直接做出概率预测,而是预测单个可能的未来。下图将 MetNet 模型的输出与 HRRR 模型的输出进行了比较。



从 NOAA MRMS 系统检索到的地面真值(中间),与 MetNet(顶部)和 HRRR(底部)输出之间的比较。请注意,尽管 HRRR 模型预测的结构看起来与地面真值更相似,但其细节可能严重错误。


HRRR 物理模型的预测看起来比 MetNet 模型的预测更清晰,更结构化,但是由于模型初始条件和参数的不确定性,其结构(特别是预测结构的确切时间和位置)的准确性较差。



HRRR(左)预测了许多可能结果中的单个潜在未来结果(红色),而 MetNet(右)则通过分配未来结果的概率来直接考虑不确定性


这个视频提供了 HRRR 与 MetNet 模型之间更全面的比较:


视频地址:https://youtu.be/-dAvqroX7ZI

未来发展方向

我们正在积极研究如何改善全球天气预报能力,尤其是在快速的气候变化影响最深的地区。虽然我们现在演示的是针对美国大陆的 MetNet 模型,但也可以将其扩展到可获得适当雷达和光学卫星数据的任何区域上。此处介绍的工作只是这一计划的小里程碑,我们希望通过与气象界的进一步合作来获得更大改进。


致谢


该项目是与 Lasse Espeholt、Jonathan Heek、Mostafa Dehghani、Avital Oliver、Tim Salimans、Shreya Agrawal 和 Jason Hickey 合作完成的。我们还要感谢 Manoj Kumar、Wendy Shang、Dick Weissenborn、Cenk Gazen、John Burge、Stephen Hoyer、Lak Lakshmanan、Rob Carver、Carla,Bromberg 和 Aaron Bell 提供的意见,并感谢 Tom Small 提供的可视化帮助。


原文链接:https://ai.googleblog.com/2020/03/a-neural-weather-model-for-eight-hour.html


2020-03-30 15:103171
用户头像
赵钰莹 极客邦科技 总编辑

发布了 894 篇内容, 共 669.5 次阅读, 收获喜欢 2691 次。

关注

评论

发布
暂无评论
发现更多内容

【API进阶之路】破圈,用一个API代替10人内容团队

华为云开发者联盟

内容 编辑 API 华为云 文本摘要

Java创建对象的方法有哪些?

古月木易

Java

Java中强、软、弱、虚四种引用详解

奈学教育

Java

为什么阿里巴巴的程序员成长速度这么快,看完他们的内部资料我明白了

Java迁哥

Java 阿里巴巴 程序员 成长 笔记

花两个半月吃透这份Java手打面经,成功从外包上岸到京东

Java迁哥

Java 学习 腾讯 面试 资料

35K成功上岸华为商城事业部,只因学透了这几个开源的商城项目

Java迁哥

Java 华为 源码 资料 商城项目

9块钱,构建个私有网盘,关键不限速

华为云开发者联盟

网站 OBS 在线网盘 华为云 云存储

数字货币钱包系统定制开发,区块链钱包源码

13530558032

JVM中unsafe.cpp源码

Darren

c++ 源码 JVM unsafe

LeetCode题解:84. 柱状图中最大的矩形,双循环暴力,JavaScript,详细注释

Lee Chen

大前端 LeetCode

区块链交易所开发源码,数字货币交易所app开发

13530558032

拥抱K8S系列-01-CentOS7安装docker

张无忌

Docker centos 运维

Docker 网络模式详解及容器间网络通信

哈喽沃德先生

Docker 容器 微服务

高效程序员的45个习惯:敏捷开发修炼之道(7)

石云升

敏捷开发 晨会

架构设计复杂度来源

escray

学习 从零开始学架构 架构师预科班

2019年我最喜欢的三款数码产品。

徐说科技

手机 苹果

week12 homework

burner

java安全编码指南之:Mutability可变性

程序那些事

Java java安全编码 编码指南 可变性

vivo商城前端架构升级-总览篇

vivo互联网技术

node.js Vue 大前端 架构设计

【运维探讨】RPA落地实践,提升IT运维工作效能!

嘉为蓝鲸

RPA 运维自动化 标准化 系统运维 流程

分析HiveQL 生成的MapReduce执行程序

任小龙

鲲鹏迁移第一批吃螃蟹的人,践行技术国际化

华为云开发者联盟

鲲鹏920 服务器 华为云 ARM芯片 X86

程序员如何获取一份高薪工作?阿里P8大牛给你一些中肯的建议

Java迁哥

Java 华为 程序员 面试 资料

ArCall远比你想象的要强大的多

anyRTC开发者

WebRTC 在线教育 直播 RTC 安卓

区块链支付系统源码开发,USDT承兑支付平台

13530558032

面经手册 · 第9篇《队列是什么?什么是双端队列、延迟对列、阻塞队列,全是知识盲区!》

小傅哥

数据结构 小傅哥 队列 ArrayDeque

JDK8 Unsafe.java 源码

Darren

源码 并发 CAS 代码注释 unsafe

实战案例丨使用云连接CC和数据复制服务DRS实现跨区域RDS迁移和数据同步

华为云开发者联盟

迁移 灾备 数据复制 云连接 数据同步

Java创建对象的方法有哪些?

奈学教育

Java

一条龙!CI / CD 、打造小团队前端工程化服务

久违

Vue 大前端 jenkins React

Java中强、软、弱、虚四种引用详解

古月木易

Java

谷歌MetNet:秒级别预测的神经网络天气模型_AI&大模型_Geek_5fu8vr_InfoQ精选文章