简历阅读- - -如何预测极端天气

您已经阅读了2篇免费月刊文章中的1篇。了解更多。

如何预测极端天气

气候科学正在人类和机器之间建立一个更加完美的联盟。

多亏了过去二十年来机器学习的进步,人类能否在……上击败计算机已不再是问题

T感谢过去二十年来机器学习的进步,人类是否能在象棋等游戏中击败计算机已不再是问题;我们将有同样多的机会赢得与叉车的板凳压力机比赛。但是,请向目前的计算机冠军谷歌的AlphaZero咨询有关国际象棋的建议理论,比如在鲁伊·洛佩兹的开场白中,主教或骑士更具价值,而你所能得到的只是一个闪烁光标的茫然凝视。理论是一种人工构造,算法不需要。计算机只知道如何在任何给定的位置上找到最佳的动作,因为它经过了广泛的训练,通过自我练习和学习什么是有效的。

即使提前18个月,神经网络也能够看到厄尔尼诺事件的到来。

AlphaZero等成功案例背后的计算方法被称为“深度学习”,之所以这么说是因为它们采用了复杂的结构,比如在输入和输出之间有多层计算节点的深度神经网络。这里输入可以获得丰厚的结构,就像棋盘上的棋子的位置或者在图像像素点的颜色值,和输出可能会评估需要做出决定,如象棋移动或可能的值的概率的照片图像吉娃娃而不是蓝莓松饼. 训练网络通常包括调整所有可用的拨号盘和模型参数,直到它在一组训练数据上表现良好,然后在单独的样本外数据集上测试其性能。对这些系统的抱怨之一是,一旦培训完成,它们可能成为一个黑匣子;算法是如何处理它所提供的信息的,以及为什么要处理这些信息,常常是个谜。(当所有这些都是一场国际象棋游戏时,这并不是什么大问题,但当同样的技术被用来确定人们的信誉或犯罪可能性时,比如说,问责的要求会上升,这是可以理解的。)节点的层次越多,学习过程中需要调整的参数越多,盒子变得越不透明。

然而,除了在棋类游戏领域占据主导地位外,深度学习算法还在金融、广告和医药等领域取得了成功。有些令人惊讶的是,下一个倒下的多米诺骨牌可能是天气预报。对于机器学习来说,这是一个令人惊讶的挑战,部分原因是传统的人类学习(由计算机增强,但只是为了处理数字)已经可以很好地处理事物。因此,这是一个有趣的案例,研究当深度学习方法侵入一个既定学科时会发生什么,以及人类和机器之间的这场新竞赛可能预示着科学的未来。


M与国际象棋不同,气象学背后有许多公认的理论。基本的物理关系,如流体动力学方程或陆地和大气之间的能量传递方程,限制了天气系统的形成和演变。事实上,当前最先进的天气预报相当于基于当前温度、风、湿度等测量值并考虑测量误差引起的不确定性,对这些方程的模拟解。从一个完全幼稚的立场出发,神经网络无论有多深,都很难掌握所有的理论知识。因此,处于机器学习和气候科学前沿的研究人员最近开始使用一种不同的方法:将我们已经知道的气象学知识与深入学习的能力结合起来,以发现我们不知道的模式。

厄尔尼诺:由传统人类学习增强的深度学习可能很快就会预测到不可预测的El Niño事件,如上图所示,2015年有四个热带气旋席卷太平洋。 NASA/NOAA GOES项目

今年9月在自然界韩国中央大学海洋学系的Yoo Geun Ham和Jeong Hwan Kim以及中国气候与应用研究所的Jing Jia Roo宣布了一种新的深度学习算法的成功,该算法可以提前18个月预测厄尔尼诺事件的发生。厄尔尼诺是指东太平洋暖、冷海面温度之间振荡的暖相,它给中期全球天气预报带来了一个长期问题。在厄尔尼诺年期间,正常的天气模式被打破,世界上一些地区出现了更潮湿的天气和更严重的风暴,而另一些地区则经历了长期干旱。最大的影响发生在南美洲西海岸,那里的强降雨可能导致灾难性的洪水,而海洋温度的变化威胁着该地区所依赖的渔业,而南太平洋的另一边则受到干旱条件、强风和干旱的三重打击,温度高于平均水平,所有这些都加剧了森林火灾的风险,就像目前在澳大利亚新南威尔士州燃烧的森林火灾一样。

El Niño的社会成本可能是巨大的;它与缺水、饥荒、传染病的传播和普遍的内乱有关。(1789-1793年El Niño期间欧洲农作物产量的下降甚至可能是法国大革命的导火索。)因此,更好地预测和准备厄尔尼诺Niño的潜在好处同样巨大。问题是,El Niño事件只是半定期地发生。记录可以追溯到19世纪末,当时El Niño首次被描述为一种全球现象,显示了两次事件之间的典型间隔时间为2至7年,但除此之外,没有真正的模式。此外,它们的严重程度和类型取决于最大的海洋温度异常出现的确切位置,每种类型都产生自己独特的天气现象组合。这取决于你住在哪里,你可能没有注意到我们刚刚完成了一个;2019年的El Niño于今年秋天结束,属于温和品种。

我们有机会击败一台国际象棋计算机,就像赢得一场板凳压力机与叉车的比赛一样。

在哈姆和他的合著者之前,最好的预报员最多可以提前一年预测厄尔尼诺事件,但有理由相信还有改进的余地。一方面,海洋温度的变化并不那么快,波动也不像个别天气系统那样混乱。异常也有一定的周期性;厄尔尼诺的暖化期之后通常会出现被称为拉尼娜(La Niña)的冷却期,就像一股巨大的暖波在太平洋上来回晃动。因此,尽管确切的原因和时间尚不清楚,但警告信号可能早就出现了。

他们决定使用卷积神经网络,与图像识别等机器视觉问题中使用的网络结构相同,来看看它是否能识别出可以预测El Niño事件的海洋温度数据的特征。然而,为了训练他们的模型,他们不能仅仅依靠历史数据,因为没有足够的历史数据。每月的海洋温度记录只能追溯到1871年,其中的一些数据需要保留下来,以验证用于训练的样本之外的模型的预测。对于最适合解决大数据问题的技术来说,El Niño的数据小得令人失望。

这里是新的数据科学与老式的气候科学相遇的地方。

他们不是用历史数据,而是先用一批模拟. 这些模拟由世界各地的研究小组制作,并作为耦合模型相互比较项目(CMIP)的一部分收集。CMIP是一项大规模的倡议,旨在共享气候模型,并对不同未来可能发生的情况进行PB级的预测比较。一些场景代表了可供选择的过去,如气候历史小说,故事足够详细,包括厄尔尼诺事件等特征。因此,模拟代表了可信的数据,受已知气候模型约束。它们可能比真实数据低了一步,但它们足够现实,可以代表真实的文章。用替代品,哈姆能够在相当于2961年观测的数据集上训练神经网络。然后,他们使用所有培训的结果作为从实际历史数据学习的起点,他们将这些数据分为从1871年到1973年的培训期间和从1984年到2017年的样本外验证期间。

结果是惊人的。神经网络的表现比之前最先进的预测要好,预测的时间越早,差距就越大。即使有18个月的提前时间,神经网络也能够预见到El Niño事件的到来,对它们的强度做出很好的估计,甚至根据温度峰值是否会出现在太平洋中部或东部对它们进行分类。它在预测北半球春季和夏季的厄尔尼诺Niños方面做得特别好,之前的模型因为厄尔尼诺Niño和南亚季风季节之间的复杂相互作用而遇到了一个“可预测性障碍”。

在这种情况下,训练一个系统在一项任务中表现良好的技术,在将知识应用于另一项任务之前,在一组模拟数据中进行厄尔尼诺预测,称为“转移学习”。哈姆在厄尔尼诺预测方面的成功表明,这种方法可以将气候学和深度学习的最佳部分结合起来。气候模型产生的模拟为神经网络提供了大量的学习数据,实际上训练它像模型那样思考,但这些模型自然会受到一些系统误差的影响。用真实的历史数据对网络进行微调,然后消除误差,让神经网络发现科学家可能没有想到要寻找的特征,最终结果是更好的预测。

作为证明他们的模型事实上吸收了气候理论的一些经验教训的最后一次感官检查,建模者使用神经网络对1997年至1998年厄尔尼诺现象进行了事后分析,这是有记录以来最严重的厄尔尼诺现象之一。他们在1996年5月、6月和7月的海洋温度下进食,发现特定区域的神经元发光,这表明厄尔尼诺事件的有利条件正在形成。从1996年开始,热带西太平洋温暖的海洋像一把装了子弹的枪一样积聚了能量,然后西南印度洋寒冷的环境将其向东发射,导致大约一年后的极端厄尔尼诺现象。亚热带大西洋比平均温度更冷的条件只会使情况恶化。与一些神秘的神谕式黑匣子不同,该模型已经确定了一些重要的特征,这些特征与气候学家所知道的世界不同地区海洋温度之间的联系以及气候故事的展开方式是一致的。网络刚刚看到它比其他任何人都来得早,如果预警系统已经到位,可能早到足以让受灾地区的人们更好地为灾难性影响做好准备。


T厄尔尼诺现象研究所展示的混合方法很可能为将成功的机器学习技术应用于气候科学等理论密集领域提供一个新的模式。这些最新突破表明,研究的未来可以是一个将传统科学和数据科学的最佳部分结合起来的合资企业,而不是争夺地盘。在另一篇文章中自然界今年,德国马克斯·普朗克生物地球化学研究所(Max Planck Institute for Biogeochemics)生物地球化学整合系的主要作者马克斯·雷克斯坦(Markus Reichstein)提出了“情境线索”(context cues)的重要性,即已知理论预测的数据中的关系,以此作为增强地球科学深度学习方法的一种方式。没有理由期待它就此结束。

与此同时,由于我们发现自己正面临着持续的气候灾难,机器学习可能会在正确的时间推动气候科学的发展。特别是,尽管El Niño影响的天气系统预计将在未来变得更加极端,但对于气候变化是否会增加El Niño事件的频率或严重性,仍然没有科学共识。政府间气候变化专门委员会(Intergovernmental Panel on Climate Change) 2013年的报告只是说,它预计El Niño将继续下去,但对它可能改变的方式没有什么信心。El Niño事件依赖于温暖和寒冷的海水、大气、信风等之间复杂的反馈回路。破坏这些周期的一部分可能会使整个周期停止,使El Niño的情况更加频繁甚至永久,或者无论哪种方式都不会有明显的影响。

弄清楚如何计划未来的极端天气就像在棋子不断变化的国际象棋游戏中找到最佳策略一样。这将需要一台超级计算机的所有学习能力,再加上一位大师的所有经验。


奥布里·克莱顿是住在波士顿的数学家。他在大学教授概率论的逻辑和哲学哈佛推广学校.

主导图像:生产周期/ Shutterstock

参加讨论