简历阅读- - -讲故事的电脑

关闭

讲故事的电脑

人工智能需要像神话中的魔术师一样思考。

究竟是什么让人类如此聪明?在他1950年的开创性论文《计算机机械与智能》中,艾伦·图灵认为

W究竟是什么让人类如此聪明?在他1950年的开创性论文《计算机机械与智能》中,艾伦·图灵认为人类的智能是复杂的符号推理的结果。麻省理工学院人工智能实验室的联合创始人、哲学家马文·明斯基也坚持认为,理性——以多种方式进行分层次思考的能力——是人类之所以为人的原因。

帕特里克·亨利·温斯顿不敢苟同。“我认为图灵和明斯基错了,”他在2017年告诉我。“我们原谅他们,因为他们是聪明的数学家,但和大多数数学家一样,他们认为推理是关键,而不是副产品。”温斯顿是麻省理工学院(MIT)的计算机科学教授,曾任该校人工智能实验室主任。他认为,人类智能的关键在于讲故事。“我认为人性的显著特征是我们构建故事的描述能力。我认为故事使我们不同于黑猩猩和尼安德特人。如果故事理解真的是我们的智慧所在,那么我们只有在理解了这一点之后才能真正理解我们的智慧。”温斯顿认为,讲故事对人类智能至关重要,也是未来创造有感知能力的机器的关键。

温斯顿于7月去世,享年76岁。他是一位杰出的学者,一位高尚的人,也是一代又一代MIT学者的良师益友,他总是向学生强调提高写作和演讲技巧的重要性。“如果你不能沟通,你就不能领导,”他教导他们。

先:已故的帕特里克·亨利·温斯顿在麻省理工学院办公室。他巨大的智力好奇心使他看到了在空间中移动、顺序思维、讲故事和人类智力之间的联系。 麻省理工学院的权力

我是在为我的书做研究时认识温斯顿的寻路:人类如何导航世界的科学和奥秘.我开始着迷于讲故事,以及大脑的一个独特部分——海马体——对我们人类在头脑中构建故事和故事的能力做出了贡献的可能性。海马体让我们记住过去的事件,也就是所谓的情景记忆,并想象未来。这也是我们创造空间表征的地方,也就是所谓的认知地图,我们每天用它来规划路线和导航到目的地。是不是因为人类需要旅行来寻找水、食物和住所,才使得我们能够将旅行组织成有开头、中间和结尾的叙事序列?讲故事是导航的进化结果吗?

人类学家米歇尔·斯卡利斯·杉山(Michelle Scalise Sugiyama)曾花了一年时间研究觅食社会的口头传统,发现故事和航海之间的联系在世界各地的文化中是多么广泛。在她对来自非洲、澳大利亚、亚洲、北美和南美的近3000个故事的分析中,她发现86%包含地形信息——旅行路线、地标、水、游戏、植物和露营地等资源的位置。她认为,人类的大脑最初被设计成对空间进行编码,但却找到了一种方式,通过将地形信息转化为故事形式的社会信息,以口头方式传递地形信息。杉山曾写道:“叙事是储存和传播对生存和繁衍至关重要的信息的工具。”“人类个体或个体在旅途中创造里程碑是觅食者口头传统的一个常见主题……通过连接离散的里程碑,这些故事实际上描绘了它们发生的区域,形成故事地图。”

“你认为老鼠是在给自己讲故事吗?”
“是的,我就是这么想的。”

在北美土著文化中,从莫哈韦到基特克桑,故事地图的例子比比皆是。1898年,弗朗茨·博阿斯(Franz Boas)描述了撒利希人故事的一个共同特征,一个被称为“文化英雄”、“变形者”或“骗子”的角色,他通过旅行赋予了宇宙的形状,他的冒险经历代代相传。人类学家吉恩·威尔特菲什(Gene Weltfish)在描述波尼人穿越中西部平原的迁徙时,描述了每个波尼人是如何沿着自己喜欢的路线迁徙的,其中一些路线几乎没有可识别的地标,很容易迷路。为了成功航行,“波尼人对这片土地的每一个方面都了如指掌,”她在书中写道失去了宇宙.“在他们的脑海里,它的地形就像一系列生动的图像,每一个都是过去发生过的这个或那个事件的形状,使它令人难忘。尤其是那些在这方面知识最丰富的老人。”同样,文化和语言人类学家基思·巴索(Keith Basso)在他的书中写道智慧是存在的阿帕奇人经常按顺序引用地名,重现一段旅程。有一天,巴索正和两个阿帕奇牛仔在用带刺的铁丝扎线,这时他听到其中一个牛仔在小声地自言自语,连续念了将近10分钟的地名清单。牛仔告诉巴索,他一直在“谈论名字”,这让他“在我的脑海里骑马”。

我并没有期望我的研究能引领我进入人工智能领域,但我发现温斯顿在他对人类智能的开创性研究中,多年来一直在探索类似的想法。例如,他对老鼠的记忆研究很感兴趣,这些研究显示,当老鼠在迷宫中导航时,它们的海马细胞会爆发活动,而老鼠后来在睡眠中会重新经历同样的路线。神经学家马特·威尔逊(Matt Wilson)最近回忆说,温斯顿“总是问,‘你认为你看到的是老鼠在给自己讲故事吗?’我会回答,‘是的,我认为他们就是这么做的!’”温斯顿巨大的求知好奇心让他看到了穿越空间、连续思维、讲故事和人类智慧之间的联系,在2017年的春天,他很有礼貌地让我听了他的课程,“人类智慧企业”,亲自去他的办公室了解这些想法。


第一次见到温斯顿是在麻省理工学院(MIT)校园斯塔塔中心(Stata Center)二楼的办公室里,那是一个72万平方英尺的超现实主义建筑《爱丽丝梦游仙境》这座由弗兰克·盖里(Frank Gehry)设计的建筑,墙壁和角落以尖锐的角度相互碰撞。温斯顿满头白发,戴着一副细细的金属框眼镜,坐在桌旁。在他身后是关于内战的各种各样的书,他是一个热情的业余学者(他最喜欢的书之一是自由的呐喊詹姆斯·m·麦克弗森(James M. McPherson)的作品,在他看来只能与莎士比亚相媲美),但引起我注意的却是他头顶上的那幅画。这是一幅装裱好的米开朗基罗壁画的复制品亚当的创造这幅画描绘了《创世纪》之前的那一刻,上帝和亚当的手指悬在空中,即将触碰并启动《圣经》中关于地球上人类的故事。

温斯顿一生的大部分时间都在麻省理工学院;他是那里的本科生,1965年获得了电气工程学位,然后在明斯基手下写了一篇博士论文。当明斯基创建了有影响力的媒体实验室时,温斯顿接管了人工智能实验室。温斯顿告诉我:“我做古怪的人工智能。”在这个古怪的人工智能领域,温斯顿为人类智能创造了一个新的计算理论。他认为,要想让人工智能超越那些只会在国际象棋或《危险边缘》(Jeopardy)游戏中获胜的系统,要构建真正开始接近人类儿童智力的系统,科学家必须首先弄清楚是什么让人类变得聪明。

《麦克白》讲的是什么?“这是得不偿失的胜利和复仇。”电脑回答道。

温斯顿利用语言学,特别是麻省理工学院(MIT)教授罗伯特·贝里克(Robert Berwick)和诺姆·乔姆斯基(Noam Chomsky)提出的假设,来解释人类语言是如何进化的。他们的观点是人类是唯一进化出认知能力去做所谓“融合”的物种。这种语言上的“操作”是这样的:一个人从一个概念系统中取下两个元素,比如“吃了”和“苹果”,然后把它们合并成一个新对象,然后再与另一个对象合并,比如“帕特里克”,形成“帕特里克吃了苹果”,以此类推,这几乎是一个无休止的复杂层次概念嵌套。他们认为,这是人类语言的核心和普遍特征,几乎存在于我们所做的一切事情中。

Berwick说:“我们可以在我们的头脑中建造这些精致的城堡和故事。没有其他动物能做到这一点。”该理论颠覆了语言发展的普遍解释:不是作为人际交流的工具,而是作为内部思维的工具。他们认为,语言不是有意义的声音,而是有意义的声音。

对温斯顿来说,合并假说是迄今为止人类如何发展故事理解的最好解释。但温斯顿也认为,创造叙事的能力来源于空间导航。他说:“我确实认为我们的大部分理解来自于物质世界,这涉及到物质在其中的运动。”。他继续说:“我认为,空间导航能够使事情井然有序。我们从已经存在的许多事情中受益,而排序是已经存在的事情之一。”,“从人工智能的角度来看,merge给你的是构建符号化描述的能力。我们已经有了按顺序排列事物的能力,而这种新的符号化能力让我们能够拥有故事、听故事、讲故事,将两个故事结合在一起形成一个新的故事,具有创造性。”温斯顿称之为强故事假设。

Sapolsky_TH-F1

我们的算法需要一个FDA

在她的新书的导言中,Hannah Fry指出了“Hello World”这个短语的一些有趣之处。她说,这个短语通常是学生第一个计算机程序的全部输出,现在还不太清楚这个短语是否应该。。。阅读更多

温斯顿决定试试能不能创造一个能理解故事的程序。不只是阅读或处理一个故事,而是从故事中收集教训,甚至传达自己对主角动机的看法。要让机器具备这种能力,最基本的功能是什么?这些功能揭示了人类的计算能力?

温斯顿和他的团队决定将他们的机器命名为Genesis。他们开始思考正常运作所需的规则。他们创造的第一条规则是演绎——通过推理得出结论的能力。温斯顿告诉我:“我们知道演绎,但在尝试创造创世纪之前,我们没有别的东西。”“到目前为止,我们知道我们需要七种规则来处理这些故事。”例如,《创世纪》需要一些他们称之为“审查规则”的东西,意思是:如果某件事是真的,那么其他的事就不可能是真的。例如,如果一个角色死了,这个人就不能变得幸福。

当给出一个故事时,《创世纪》创造了一个被称为代表性基础的东西:一个图形,它将故事分解,并通过分类线程和案例框架连接其各个部分,并表达关系、动作和序列等属性。然后,《创世纪》使用一个简单的搜索函数来识别从因果关系中产生的概念模式,这在某种意义上反映了它的第一次阅读。基于这个过程和七种规则类型,程序开始识别故事文本中没有明确说明的主题和概念。最初让温斯顿着迷的是,《创世纪》需要一套相对较小的规则类型,才能在接近人类理解的水平上成功地理解故事。温斯顿说:“我们曾经认为我们需要大量的陈述。”。“我们现在知道,我们只需要几个就可以脱身。”

“你想要一个示范吗?”他问我。我把椅子转到他桌子的另一边,看着温斯顿打开了创世纪项目。“《创世纪》里的一切都是英文的,包括故事和知识,”他说。他在程序的文本窗口中输入了一个句子:“一只鸟飞到了树上。”在文本窗口下面,我看到列出的案例框架。《创世纪》认为故事的主角是鸟,行动是苍蝇,目的地是树。甚至还有一个“轨迹”框架,通过一个箭头击中一条垂直线来图解动作的顺序。然后温斯顿把描述改成了“一只鸟飞向一棵树。”现在箭在离线不远的地方停了下来。

“现在让我们试试麦克白,”温斯顿说。他打开了一个书面版本麦克白从莎士比亚的语言翻译成简单的英语。那些引语和比喻都不见了;总结的故事情节被缩减到100句左右,只包括人物类型和事件的顺序。在短短几秒钟内,创世纪读了概要,然后给我们展示了一个可视化的故事。Winston称这种可视化为“精化图”。上面有“麦克白夫人是麦克白的妻子”、“麦克白谋杀了邓肯”等20多个箱子。下面是连接其他框的线,连接故事的显性和推断元素。创世纪是怎么想的麦克白是什么?“得不偿失的胜利和复仇,”它告诉我们。这些单词都没有出现在故事的文本中。温斯顿回到主导航页,点击了一个叫做“自我故事”的框。现在我们看到,在一个叫做“内省”的窗口中,创世纪对故事的理解,以及它推理和推理的顺序。“我认为这很酷,因为Genesis是一个在某些方面具有自我意识的项目,”他说。


B在机器中构建复杂的故事理解可以帮助我们为教育、政治体系、医学和城市规划创造更好的模型。例如,想象一下,一台机器不仅拥有几十条理解文本的规则,还拥有数千条可以应用于数百页长的文本的规则。想象一下,在一桩证据令人费解、潜在行凶者众多的棘手谋杀案中,FBI使用了这样一台机器。或者进入战况室(Situation Room),向美国外交官和军事情报人员提供有关俄罗斯黑客动机或中国在南中国海(South China Sea,中国称南海)好战行为的分析,并根据对100年历史的分析计算未来行为的预测。

温斯顿和他的学生使用Genesis分析了2007年爱沙尼亚和俄罗斯之间的网络战。他们还找到了一些创造性的方法来测试它的智力,比如促使它自己讲故事,或者调整它的视角,从不同的心理角度来阅读故事——例如,亚洲人还是欧洲人。温斯顿的一个研究生赋予了创世纪教授和说服读者的能力。例如,在《韩塞尔与格莱托》中,学生要求《创世纪》让伐木工看起来不错。作为回应,《创世纪》增加了一些句子,强调了这个角色的美德。

计算机没有身体能思考吗?教室里很安静。

温斯顿的学生找到了让创世纪精神分裂的方法。温斯顿说:“我们认为精神分裂症的某些方面是故事系统根本崩溃的结果。”他给我看了一幅卡通插图。它描绘了一个小女孩试图打开一个高得够不着的门把手,然后拿了一把雨伞。一个健康的人会推断女孩拿伞是为了伸手开门;精神分裂症患者会做一种被称为“超假设”的事情——推断那个女孩在雨中拿着雨伞外出。为了让Genesis像精神分裂症患者那样思考,温斯顿和他的学生在程序中切换了两行代码。他们把创世纪在寻找默认答案(女孩将会去雨中)之后,寻找将故事元素联系在一起的解释放在了一起。根据创世纪公司的说法,过度推定是一种大脑测序功能紊乱。他们称之为错误故事机制推论。

温斯顿曾在麻省理工学院(MIT)的学生沃尔夫冈·维克多·海登·亚洛特(Wolfgang Victor Hayden Yarlott)是工程和计算机科学专业的学生,2014年毕业,目前在佛罗里达国际大学(Florida International University)攻读博士学位。亚洛特是克劳印第安人,他有一个想法:如果温斯顿关于故事是人类智慧的关键部分的强大故事假设是正确的,《创世纪》需要证明它理解所有文化的故事,包括土著文化,比如克劳文化。Yarlott在他的论文中写道:“故事是智慧和知识代代相传的方式——无法理解任何文化的故事意味着要么假设是错误的,要么创世纪系统需要更多的研究。”

亚洛特为《创世纪》选了一组克劳的故事,其中包括他童年在蒙大拿州南部听过的创世神话。他面临的挑战是在《创世纪》中让人们认识到看似不相关的一系列事件,认识到像医学(在克劳人的民间传说中有一种魔力的性质)这样的超自然概念,认识到“骗子”的人格特征。这些都是克劳故事的元素,正如亚洛特所确定的,区别于盎格鲁-欧洲故事的标准。创造神话“老土狼创造世界”的特点是,动物们像人类一样与老土狼交流。正如Yarlott指出的,有一种惊人的力量或药物的展示,使老土狼能够创造——但故事中有一些明显不可知的事件发生,比如,“他是如何做到的,没有人能想象。”为了解决这些问题,Yarlott必须给Genesis新的概念模式来识别。例如,

“Creation”的开始描述。
XX和YY为实体。
YY不存在导致XX创建YY
最后。
“成功的骗子”开始描述
XX是一个人。
YY是一个实体。
XX想骗YY导致了XX想骗YY最后。
“Vision Quest”的开始描述。
XX是一个人。
YY是一个地方。
XX的YY之旅让XX有了一个愿景。
最后。

亚洛特告诉《创世纪》的故事是这样的:

开始实验。
注意"老土狼"是个名字。
注意,“Little_Duck”是一个名字。
注意“Big_Duck”是一个名字。
请注意“Cirape”是一个名字。
插入文件乌鸦常识知识。
插入文件乌鸦反光知识。
"骗子"是一种人格特征。
故事开头名为“老狼创造世界”。
老土狼是一个人。
小鸭子是一只鸭子。
大鸭子是一只鸭子。
Cirape是一只土狼。
泥巴是一个物体。
"偷老婆的传统"是真的。
老土狼看到了空虚,因为这个世界根本不存在。
老土狼不想要空虚。
老土狼试图摆脱空虚。

亚洛特发现,《创世纪》能够对这个故事做出几十个推论,也有几个发现。它触发了故事中没有明确表述的想法的概念模式,认识到信仰被亵渎、起源故事、药师和创造的主题。它似乎理解了克罗文学的元素,从不可知的事件到医学的概念,到对所有生物的统一治疗,以及把差异作为力量的源泉的想法。“我相信,这是向我们展示《创世纪》能够处理克劳文学故事的坚实一步,”他猜测,“《创世纪》是一个理解故事的全球系统,不管故事来自什么文化。”

《创世纪》有明显的缺陷:到目前为止,它只理解基本的语言,没有隐喻、对话、复杂的表达和引用。为了提高理解能力,《创世纪》需要更多的概念模式——换句话说,更多的教学。在一个孩子长大成人的过程中,她听到、创造和阅读了多少个故事?也许是数十万。但是,即使Genesis能够访问同样数量的故事,这台机器的潜力可能还有更基本的限制。


O一个雨天,我去看了温斯顿在麻省理工学院教授他很受欢迎的本科课程“人工智能入门”。我听他向数百名学生解释强大的故事假设,并展示了它的能力。“华生能做到吗?””他打趣道。但随后他向他的年轻学生提出了一系列问题,对他的发明提出了质疑。

“没有语言我们能思考吗?”

房间里很安静。

他解释说:“我们从那些没有语言皮层的人那里得知,他们无法阅读、说话或理解口语。”“他们是愚蠢的吗?他们仍然可以下棋,做算术,寻找藏身之处,处理音乐。即使外在的语言器官被吹走了,我认为他们仍然有内在的语言。”

他停顿了一下。“没有身体我们能思考吗?”

安静。

“如果没有荷尔蒙系统,创世纪对爱情又有什么了解呢?””他说。“如果它没有腐烂的身体,它又怎么知道死亡呢?”它还能聪明吗?”

当学生们列队走出演讲厅时,我惊叹于爱与死。世界上最史诗的故事。如果没有空间和时间的体现,创世记能理解这些普遍的人类条件吗?温斯顿认为接下来需要回答的问题之一是人类通过自我发现学习了多少。《创世纪》的教学方式与父母教孩子的方式相同,但孩子们也有直接的经验,他称之为“代孕经验”,通过阅读帮助他们独立制定规则和概念。这种自我发现过程是否可以通过某种方式进行计算建模?或者,我想知道,《创世纪》会不会以某种方式重现人类在景观和思维中的寻路方式?正如温斯顿本人在演讲结束时所说,“我们将把这部分故事留到下次再说。”


奥康纳先生是本书的作者寻路:人类如何导航世界的科学和奥秘。她写的是关于科学、技术和保护的政治和伦理。她的报道出现在网上《纽约客》《科学》《外交政策》大西洋.2016/17学年,她是麻省理工学院奈特科学新闻研究员。

改编自寻路:人类如何导航世界的科学和奥秘奥康纳先生。作者版权所有©2019,经圣马丁出版集团许可转载。

主导图像:Vasilyev Alexandr / Shutterstock

加入讨论