Google发布神经天气模型，几秒钟预测整个美国的降水量

　　准确预测未来几分钟到几周的天气是一项基本的科学挑战，它可以对社会的许多方面产生广泛影响。

　　很多气象机构目前采用的预报是基于大气的物理模型。尽管在过去几十年有很大的改进，但这些模型本身受到计算要求的限制。并且，它们对物理定律的近似值非常敏感。

　　另一种能够克服这些限制的天气预报方法是使用深神经网络（DNNs）。DNNs 在强大的专用硬件（如 GPU 和 TPU）上使用并行计算，发现数据中的模式，并学习从输入到所需输出的复杂转换。

　　近日，在先前对降水量预报的研究基础上，Google 提出了 MetNet，这是一种用于降水预报的神经天气模型。这种 DNN 能够在未来 8 小时内以 1km 的分辨率预报降水量，时间间隔为 2 分钟。MetNet 的预测时间比 NOAA 目前使用的最先进的基于物理的模型提前了 7-8 小时。它可以在几秒钟内对整个美国的降水量进行预测，而 NOAA 需要花费一小时。

　　网络的输入来自雷达站和卫星网络，无需人工标注。模型输出是一个概率分布，Google 用它来推断每个地理区域的降水率和相关的不确定性。下图提供了该网络对美国大陆的预测示例。

Google 发布神经天气模型，几秒钟预测整个美国的降水量

　　MetNet 模型预测结果与 NOAA 多雷达/多传感器系统（MRMS）测量的地面真实值进行了比较。MetNet 模型（上图顶部）显示了从 2 分钟到 480 分钟前预测的每小时 1 毫米降水的概率，而 MRMS 数据（上图底部）显示了在同一时间段内接收到至少每小时 1 毫米降水的区域。

　　神经天气模型

　　MetNet 不依赖于大气动力学领域的物理定律，它是通过反向传播学习，直接从观测数据中预测天气。该网络使用由多雷达/多传感器系统（MRMS）组成的地面雷达站，以及提供大气中云层自顶向下的视图的卫星系统测量得出的降水量估计值。这两个数据源均覆盖美国大陆，并提供可由网络有效处理的图像类输入。

　　该模型每 64km*64km 执行一次，覆盖整个美国，其分辨率为 1 km。然而，与这些输出区域相比，输入数据的实际物理覆盖范围要大得多，因为它必须考虑到在进行预测的时间段内云和降水场的可能运动。

　　例如，假设云以每小时 60km 的速度移动，为了作出可靠的预测，捕捉到 8 小时前的大气时间动态，模型需要 60*8=480km 的全方位空间背景。因此，要达到这个程度，需要 1024km*1024km 区域中的信息来对中心 64km*64km 补丁进行预测。

Google 发布神经天气模型，几秒钟预测整个美国的降水量

　　包含卫星和雷达图像（1024 *1024 平方公里）的输入补丁和输出预测雷达图像（64*64 平方公里）

　　由于以全分辨率处理 1024km*1024km 的区域需要大量内存，因此研究人员使用空间下采样器，通过减少输入面片的空间维度来减少内存消耗。同时，在输入中查找并保留相关的天气模式。然后沿降采样输入数据的时间维度应用时间编码器，对 90 分钟输入数据的 7 个快照进行编码，编码片段长度为 15 分钟。时间编码器采用卷积 LSTM 实现，该卷积 LSTM 特别适合于图像序列。

　　然后，时间编码器的输出被传递到空间聚集器，空间聚集器使用轴向自关注，有效地捕获数据中的长距离空间依赖性，并基于输入目标时间使用可变数量的上下文，以在 64km*64km 的输出上进行预测。

　　这种结构的输出是一个离散的概率分布，估计美国大陆每平方公里的给定降水率的概率。

Google 发布神经天气模型，几秒钟预测整个美国的降水量

　　神经气象模型 MetNet 的结构

　　结果

　　研究人员根据一个降水率预测基准对 MetNet 进行评估，并将结果与两个基线进行比较：NOAA 高分辨率快速刷新 HRRR 系统，这是目前在美国运行的物理天气预测模型；一个估计降水场运动（即光流）的基线模型，它是一种在预测时间少于 2 小时时，表现也很好的方法。

　　Google 的神经天气模型的一个显著优点是，它是为密集并行计算而优化的，并且非常适合在专用硬件（如 TPU）上运行。无论是针对纽约市这样的特定地点还是针对整个美国，预测可以在几秒钟内并行进行。而像 HRRR 这样的物理模型在超级计算机上的运行时间约为一小时。

　　在下面的图表中，研究人员量化了 MetNet、HRRR 和光流基线模型之间的性能差异。这里展示了这三个模型所取得的性能，在降水率阈值为 1.0mm/h（相当于小雨）时使用 F1 分数进行评估。MetNet 神经天气模型能够在 8 小时内超过 NOAA-HRRR 系统，并且始终优于基于流量的模型。

Google 发布神经天气模型，几秒钟预测整个美国的降水量

　　1. 0 mm/h 降水率（越高越好）下的 F1 得分评估性能。神经天气模型（MetNet）比目前在美国运行的基于物理的模型（HRRR）的时间尺度要提前 8 小时。

　　由于大气的随机性，未来天气状况的不确定性随着预测时间的延长而增加。

　　MetNet 是一个概率模型，随着预测时间的延长，预测的不确定性在可视化中表现为预测的日益平滑。相反，HRRR 并不直接进行概率预测，而是会对未来的降水情况进行单一的预测。下图比较了 MetNet 模型和 HRRR 模型的输出。

Google 发布神经天气模型，几秒钟预测整个美国的降水量

　　从 NOAA MRMS 系统获得的 MetNet（上）和 HRRR（下）到地面真值（中）的输出之间的比较。注意，虽然 HRRR 模型预测的结构似乎更接近于基本事实，但预测的结构可能严重错误。

　　与 MetNet 模型相比，HRRR 物理模型的预测更清晰、更结构化。但其结构，特别是预测结构的准确时间和位置的精度较低。这是由于初始情况和模型参数的不确定性造成的。

Google 发布神经天气模型，几秒钟预测整个美国的降水量

　　HRRR（左）从许多可能的结果中预测单个潜在的未来结果（红色），而 MetNet（右）通过分配未来结果的概率直接解释不确定性。

　　研究人员对 HRRR 和 MetNet 模型之间进行了比较，感兴趣的可以打开视频观看：https://youtu.be/-dAvqroX7ZI

　　未来方向

　　Google 正在积极研究如何改进全球天气预报模型，尤其是在气候快速变化很大的地区的准确性。虽然上文展示了美国大陆目前的 MetNet 模型，但它可以扩展到任何有足够雷达和光学卫星数据的地区。本文提出的工作是这一努力的一个小小的垫脚石，Google 希望通过今后与气象界的合作，能够带来更大的改进。

　　via：https://ai.googleblog.com/2020/03/a-neural-weather-model-for-eight-hour.html

Google发布神经天气模型，几秒钟预测整个美国的降水量

相关资讯