复读-神经网络将重塑物理学吗?

关闭

你已经阅读了每月两篇免费文章中的一篇。学习更多的知识。

关闭

神经网络将重塑物理学吗?

机器学习的革命被夸大了。

人工智能能自学物理定律吗?传统的计算机会很快被深层神经网络所取代吗?加里·马库斯和欧内斯特·戴维斯

C一个人工智能会教自己物理定律?传统的计算机会很快被深层神经网络所取代吗?如果你一直关注新闻,看起来确实是这样的,最近的新闻标题都是这样的,“神经网络解决三体问题的速度要快1亿倍机器学习提供了一种全新的方法来解决应用数学的经典问题之一。如果有了机器学习,谁还需要哥白尼?”. 另一位记者在一篇名为“的文章中描述了后者。”人工智能教自己物理定律作为“人工智能和物理学的里程碑时刻”,它“可能是解决量子力学问题的关键”。

问题是,作者们并没有给出令人信服的理由来证明他们确实可以做到这一点。

这些说法都不是真的。所有这些研究都来自最近的两项研究,这两项研究使用机器学习来探索行星运动的不同方面。这两篇论文都代表着对新事物的有趣尝试,但都不能保证令人兴奋。这两篇论文中夸大的说法,以及由此引发的炒作,都是科学记者——有时是科学家自己——夸大人工智能和机器学习新进展重要性的趋势的征兆。

和往常一样,当人们看到对AI系统的大量评论时,首先要问的问题是:“这个系统实际上是做什么的?”

三体问题

三体问题是预测三个物体(通常是行星或恒星)在相互引力作用下如何随时间移动的问题。如果只有两个物体,那么,正如牛顿所证明的,其行为很简单:每个物体都沿着一个圆、一个椭圆或一条双曲线移动。但是,正如牛顿及其继任者所确定的,当涉及到三个或三个以上的物体时,行为会变得非常奇怪和复杂。没有简单的数学公式;在较长的时间内准确预测变得非常困难。找到计算三体问题解决方案的好方法以及n-身体问题(同样的问题,有更多的物体)300年来一直是计算物理学的主要挑战。“AI解决了三体问题”的文章是基于arXiv上一篇题为“AI解决了三体问题”的文章。牛顿vs机器:用深度神经网络解决混沌三体问题.”

通常情况下,技术类文章没有通俗文章那么夸张,但是,作为一篇技术类科学文章,这篇文章还是很有野心的。文章最后预测,为狭义情况开发的技术将扩展到一般的三体问题,然后最终扩展到四体和五体问题以及其他混沌系统,这可能构成一场真正的革命。

问题是,作者们并没有给出令人信服的理由来证明他们确实可以做到这一点。事实上,他们甚至还没有完全解决现有的三体问题。相反,他们只关注三体问题的一种特殊情况,即三个质量相等的粒子以零速度从特定位置出发。

即使在这里,它们也完全依赖于传统的物理引擎或模拟器——也就是说,没有人工智能,没有机器学习,只是传统的运动微分方程的数值解——从10000个不同的起始位置生成运动轨迹。

媒体的热情正在传递一种错误的印象,让人觉得任何老问题都可以用神经网络来解决。

然后,他们使用这个经典衍生数据库作为输入,来训练神经网络。在新实例上对神经网络进行测试时,他们发现神经网络能够以合理的精度预测粒子的后期位置,比传统模拟器快几个数量级,真实解也由模拟器计算。

从本质上说,他们所做的就是将神经网络作为一种新的工具,用于从外部经典系统中得到的已知值进行插值。与其他技术相比,神经网络可能更擅长于用平滑的值空间进行插值,但大部分工作都是由外部先验系统完成的。而且,关键的是,他们还没有证明,同样的插值方法在现实世界中更复杂的物理中也能起作用,即使是在简单的情况下(质量不同的粒子),更不用说在有多于三个物体的情况下。

同时,在技术术语中,即使在三体问题中,他们已经解决的这类问题也只是一个简单的子集,即两个自由度——也就是说,一个问题的实例是由两个数值参数决定的——而一般的三体问题有10个自由度。在这个问题的有限版本中,你在构建一个从根本上改变行为的问题时,唯一的选择就是相对于前两个物体,第三个物体应该放在哪里。在整个问题中,他们没有尝试,你可以额外选择第二个和第三个物体的质量和初速度;这些选择中的每一个都能从根本上改变系统随时间的演变。

我们知道这类问题的复杂性会随着自由度的增加呈指数增长。所以他们解决的问题并不是一般问题的五倍,而是简单得多。随着点的增加问题很快变得更糟四体问题有17个自由度,五体有24个自由度n-身体有7个n-11年。

其次,如果您只需要担心二维,那么计算10,000个数据点就可以提供很好的覆盖范围。假设,你想绘制出一座山的形状,你测量了10000个点的高度——本质上,在一个100 x 100的网格上的每一个点——然后你就可以相当可靠地估计其中任何一点的高度。随着维数的增加,事情变得更加复杂,平滑插值工作的可能性减少。

第三,科学家们未能在房间里与800磅重的混沌蝴蝶搏斗:高度依赖于起始条件。两种稍有不同的起始条件可能导致根本不同的结果。这不是你用来进行预测的算法的局限性;这是混沌蝴蝶的固有特征问题。因此,声称机器学习系统已经学会了长期预测混沌系统就像说它已经学会了预测随机过程的行为,如热噪声或放射性衰变。无论采用何种算法,这都是无法做到的卡罗琳·德尔伯特《大众机械》注意到这;大多数记者都没有注意到。)

最后,即使是与传统模拟器的比较也是有缺陷的。纽约大学数学系的乔纳森·古德曼(Jonathan Goodman)是这类动力系统的专家,他向我们保证,现代自适应方法计算这些轨迹的速度比论文中引用的时间要快得多;传统的模拟器是一个吸管模型。

发现者:说神经网络推断行星绕太阳旋转是误导人的。它不明白任何东西都是围绕着任何东西转的。这个系统是一个计算器,哥白尼是发现者。 Mario Breda / Shutterstock

哥白尼

哥白尼计划的情况也好不到哪里去。

这里有一组不同的作者,在即将出版的作品中身体检查信件,构造了一个神经网络,用于从物理过程中获取数值数据作为输入,并提取决定过程行为的关键参数。他们描述了四个涉及不同类型的简单物理系统的实验,在这些实验中,他们的神经网络如他们所希望的那样成功。

从天文观测中重新发现哥白尼体系的假设引起了大众媒体的兴奋。

问题是,说他们的神经网络推断出“地球和火星绕着太阳转”完全是误导。从几何意义上讲,神经网络并不真正理解任何东西是围绕着任何东西旋转的;它没有几何感,也不知道旋转意味着什么。神经网络所做的就是提取其中的两个数值参数;它不知道这些角是从某个固定的中心点开始的。就网络而言,这些可能是时变的质量,或电荷,或来自两个不同中心点的角度。数据来源之间的相关性被提取出来,但系统没有对这些数据来源如何与世界相关做出推断;正是人类科学家将这些参数确定为地球和火星从太阳处测量的角度,并抽象出这样的事实,即这些参数最好用轨道来解释。哥白尼的所有发现都是提前完成的;这个系统是一个计算器,而不是一个发现者。

此外,在作者生成的合成数据中,地球和火星在同一平面上以等速圆形轨道运行。在真实的太阳系中,情况要复杂得多:火星轨道平面倾斜1.8度o到地球轨道(黄道)的平面。因此,火星相对于恒星的明显位置不只是在一个东西圆上移动,就像如果这两个轨道是共平面的那样;它也在南北弧线上来回移动大约4o长。经过几年的观察,火星在天空中的位置不会停留在一个简单的圆形路径上;它的横线是4o最宽处也很宽。哥白尼真正的挑战(在现代计算机出现之前很久就解决了,而且没有大数据)比网络要复杂得多。

火星的角度:火星显示在离黄道面最远的位置。在这一点上,从太阳到火星的直线和黄道面之间的角度是α = 1.8o.地球的位置,也就是火星所在的位置,每年都在变化。地球(1)是地球离火星最近的位置;当地球在那里时,从地球到火星的直线与黄道之间的角度是β = 5.5o.地球(2)是地球离火星的最远位置;当地球在那里时,从地球到火星的线与黄道之间的角度是γ = 1.1o.为了清晰起见,垂直轴被夸大了。

4度听起来可能很小,但以天文观测的标准来看,它是巨大的。相比之下,猎户座的腰带只有2.7英寸o宽的托勒密的测量阿尔莫斯特大多精确到1/10度以内。

因此,托勒密和哥白尼的太阳系模型都必须有机制来解释火星和其他行星的横向运动。因此哥白尼模型必然要比简单模型复杂得多,简单模型是由神经网络产生的(某种意义上),在神经网络中,地球和火星以圆形轨道围绕太阳旋转。事实上,哥白尼模型包含了48个本轮,比托勒密模型多,尽管它在其他方面更简单。网络系统甚至不参与横向运动。

他们成功地复制了哥白尼的成就,受到鼓舞,作者和记者期待着这种机器学习技术在理论物理学方面取得突破性进展的日子。一篇文章自然新闻甚至热情地说,“一个自学物理定律的神经网络可以帮助解决量子力学的奥秘。”

这纯粹是幻想。在本实验的例子中,观察到的数据和提取的参数之间的关系是相当直接的。相比之下,在大多数量子理论的实验证据中,观测和基本理论之间的关系是非常间接和微妙的,需要非常巧妙的理论来揭示;检测这些神经网络系统的相关性,甚至还没有触及所需的表面。

为什么它很重要

这些特定研究的缺陷本身并不大,但它们被报道的方式是一个问题的症状,而这个问题实际上是严重的。这种夸大其词的报道让人们错误地相信了这个观点——最臭名昭著的是克里斯·安德森在2008年发表的那篇臭名昭著的文章,理论的终结:数据泛滥使科学方法过时,并日益成为普遍的时代思潮的一部分,即人工智能和深度学习理论将很快取代所有其他计算方法,甚至是知识方法,而目前这类方法还没有建立起来。媒体对深度学习的热情正在传递一种错误的印象,让人觉得任何老问题都可以通过庞大的神经网络和正确的数据集来解决,而无需关注该领域的基础知识。

事实上,世界上许多困难的、开放的问题都需要特定领域的大量专业知识。在这两篇论文的这类问题中,这意味着如果有人想对三体问题或类似问题的解决做出有用的贡献,就必须花大量的时间来研究复杂的科学,如微分方程、数值计算和动力系统。在自然语言理解领域,这可能也意味着要结合语言学和心理语言学的大量工作,而不仅仅是收集大量的数据集和复杂计算机的大量装配。

关于数据+神经网络是一个普遍公式的普遍错误印象产生了真正的后果:科学家选择研究什么,公司和政府选择资助什么,期刊和会议选择出版什么,学生选择学习什么,大学选择教什么。现实是神经网络,以其目前的形式,无法取代几个世纪以来发展起来的复杂的科学分析工具,迄今为止还没有复制过去的伟大科学成就,更不用说对其进行改进了。它们应该被视为补充现有技术的工具,而不是基础性的工具对我们如何做科学的看法。


确认

感谢乔纳森·古德曼提供了关于三体问题研究的非常有用的信息,感谢他和凯尔·克兰默对草稿的有益反馈。


加里·马库斯和厄尼·戴维斯合著了重新启动人工智能:构建我们可以信任的人工智能,以及许多关于认知心理学和人工智能的科学和流行文章。

加里·马库斯是一位科学家、畅销书作家和企业家。他是公司的创始人兼首席执行官Robust.AI他是机器学习公司几何智能(Geometric Intelligence)的创始人兼首席执行官,该公司于2016年被优步收购。除了重启电脑,他是五本书的作者,包括代数思维克鲁格思想的诞生,纽约时报最好的卖家吉他零。

厄尼·戴维斯(Ernie Davis)是纽约大学Courant数学科学研究所的计算机科学教授。他是人工智能常识推理领域的世界领先专家之一。他是四本书的作者,包括教科书常识性知识的表示计算机科学应用中的线性代数与概率信息时代的诗篇轻诗集他与已故的父亲菲利普·j·戴维斯(Philip J. Davis)一起担任编辑工作数学、实体与猜想:数学的意义与本体论

铅图像:metamorworks / Shutterstock

加入讨论