复读-为什么深蓝象棋计算机像人一样下棋

您已经阅读了2篇免费月刊文章中的1篇。了解更多。

为什么深蓝象棋计算机像人一样下棋

随机性可能是人类和计算机创造力的关键。

当IBM的深蓝在1997年的一场六局国际象棋比赛中击败国际象棋大师加里·卡斯帕罗夫时,卡斯帕罗夫开始相信他面对的是大卫·奥尔巴赫

W当IBM的深蓝在1997年的一场六局国际象棋比赛中击败国际象棋大师加里·卡斯帕罗夫时,卡斯帕罗夫开始相信他面对的是一台能够体验人类直觉的机器。“机器拒绝移动到一个具有决定性短期优势的位置,”卡斯帕罗夫在赛后写道。它“显示出一种非常人性化的危险感。”1.在卡斯帕罗夫看来,深蓝似乎正在体验这场比赛,而不仅仅是在计算数字。

就在几年前,卡斯帕罗夫曾宣称:“没有一台计算机能打败我。”2.当一个人最终做到这一点时,他的反应不仅是认为电脑比他聪明,而且还认为它变得更人性化了。对卡斯帕罗夫来说,国际象棋中有一种独特的人类成分,是计算机无法模拟的。

卡斯帕罗夫没有感受到深蓝中真实的人类直觉;在IBM工程师团队不断观察和管理的代码中,没有任何类似的地方人类思维过程. 但如果不是这样,那又怎样?答案可能从另一组游戏开始,它们的名字不太可能是围棋、六角形、哈瓦那和Twixt。所有这些都有一个相似的设计:两个玩家轮流将棋子放在一个相当大的棋盘上任何剩余的空闲空间上(Go是19乘19,Twixt是24乘24)。目标是通过围住围棋中的大部分区域,用十六进制连接棋盘的两个相对的边,等等,来达到某种获胜的配置。

卡斯帕罗夫是否真的在深蓝的剧本中发现了类比思维的暗示,并将其误认为是人为干预?

计算机下棋的通常方式是单独考虑各种移动可能性,评估所得到的棋盘,以及按或多或少有利的等级移动。然而对于像Go和Twixt这样的游戏,这种方法失败了。然而,在国际象棋的任何一点上,最多有几十种可能的棋步,这些游戏提供数百种可能的棋步(Arimaa的情况是数千种,它被设计成计算机无法击败的象棋类游戏)。对于一台计算机来说,在一段合理的时间内,对所有或大多数可能的棋盘位置进行评估(向前移动几步以上)很快变得不可能:组合爆炸。此外,即使是评估的概念也比国际象棋更难,因为在如何判断特定棋盘配置的价值方面,人们没有达成一致意见。

沉思:加里·卡斯帕罗夫在与深蓝队的第六场也是最后一场比赛开始时。他会继续输下去。 斯坦·本田/法新社/盖蒂图片社

然而,对于人类来说,这些游戏仍然可以玩。为什么?计算机科学家兼高级围棋选手马丁·穆勒给了我们一个提示:

人类识别的模式远不止是大块的石头和空旷的空间:玩家可以感知石头群之间的复杂关系,并很容易掌握诸如“轻”和“重”石头之类的模糊概念。游戏的这种视觉特性符合人类的感知,但很难在程序中建模。3.

换句话说,围棋策略不在于对游戏的严格形式化表示,而在于各种不同的视觉模式识别和相似性分析:将碎片分类成不同的形状和块,将它们与相同或视觉上相似的模式进行比较,并迅速将研究空间缩小到可管理的水平。卡斯帕罗夫是否真的在深蓝的剧本中发现了类比思维的暗示,并将其误认为是人为干预?


A.纳洛伊学在思考问题上有着悠久的历史。

认知语言学家,如马克·特纳和吉尔斯·福康涅,根据乔治·拉科夫(我们赖以生存的隐喻),强调概念“整合”的类比过程是人类认知各个层面的核心,从辨别图像到创造性写作,再到将数学概念应用于世界。4,5历史学家和哲学家阿瑟·米勒(天才的洞察力)6.历史学家安德鲁·罗宾逊(Andrew Robinson)都强调,不断进行创造性的概念类比是科学创新和革命的核心。

但类比对计算机,甚至对支撑计算机科学的形式逻辑都是一个重大挑战。数学家Stanislaw Ulam认为类比是扩展形式逻辑以涵盖整个世界的关键:当你看到一个物体作为一把钥匙,你看到一个人在一辆车里作为一个乘客,你看到一些纸是一本书,它是“As”这个词,它必须在数学上是形式化的,与连接词和“或”、“暗示”、“不”…7.

众所周知,计算机不善于推断类比关系,比如说,一张马的图片描绘了一类被称为“马”的物体的实例;我们马上就看到了马(或汽车,或飞机,或其他任何东西)的类比——即使是在高度可变性的情况下。

这是一个没有策略的元策略!

计算机科学家和复杂性理论家梅勒妮·米切尔(Melanie Mitchell)曾在道格拉斯·霍夫施塔特(Douglas Hofstadter)手下学习,她研究了计算机如何借助形状原型对物体进行分类。这些实验使用神经网络和“已学习形状”字典来匹配新形状和新形状。在2013年的一项研究中,米切尔做出了一个惊人的发现:如果算法字典被删除,并替换为一系列随机形状投影进行匹配,那么算法的表现同样出色。8.虽然直觉可能表明大脑建立了与世界上的物体相对应的表征原型,但米切尔的研究表明,纯粹的随机性可能在概念化过程中起着重要作用。

这些结果在多大程度上说明了人类的类比尚不清楚。但它们揭示了这样一种可能性:我们的类比过程可能比我们想象的更不理性、更随机,我们大脑中与之匹配的深层原型与现实的关系可能比我们想象的要小得多理性可能存在于神经生物学过程中,这些过程看起来更接近随机试验和错误。在这种观点中,人类的创造力和随机性是相辅相成的。

随机性的力量在新方法中表现得淋漓尽致,这些新方法最终使计算机能够在专业水平上玩Go、Hex、Havannah和Twixt等游戏。9这些方法的核心是一种称为蒙特卡罗方法的算法,其名副其实,依赖于随机的统计抽样,而不是为每一个可能的移动评估未来可能的电路板配置。例如,对于一个给定的移动,蒙特卡罗树搜索将从该移动开始播放大量随机或启发式选择的未来游戏(“播放”),其中任何一个玩家的移动背后都没有什么策略。大多数可能性都没有发挥出来,因此限制了大规模的分支因素。如果一个移动倾向于导致更多的胜利游戏,不管当时采用的策略,它被认为是一个更强的移动。这样的想法是,这样的抽样通常足以估计出一个动作的总体强弱。

如果有什么不同的话,蒙特卡罗方法似乎仍然比计算机象棋方法更愚蠢,因为现在计算机不再评估棋盘位置,而是随机(或至少部分随机)玩游戏,并抽样可能性。这是一个没有策略的元策略!但是蒙特卡罗方法更适合于高分支游戏,而不是试图对特定棋盘位置的力量进行精确评估的“战略性”方法。

卡斯帕罗夫打深蓝时可能感觉到的是出现就像那种创造性的随机性,他认为这是“人类”对危险的直觉。深蓝程序员冯雄旭在他的书中写道深蓝背后在比赛中,外界分析人士对该程序的一个神秘动作产生了分歧,认为它要么软弱,要么具有间接的战略意义。最终,程序员们发现,这一动作仅仅是一个错误的结果,该错误导致计算机无法选择它实际计算出的最好的动作,而这可能是错误的这只虫子直到第四场比赛后才被修复,也就是卡斯帕罗夫精神崩溃很久之后。


大卫·奥尔巴赫是住在纽约的作家和软件工程师。他为每个人写位列石板


参考文献

1.IBM欠人类一场重赛。时代杂志149, 66-67 (1997).

2.许福华。深蓝背后:打造击败世界象棋冠军的电脑普林斯顿大学出版社(2002年)。

3.Müller,M.电脑开始。人工智能134, 145–179 (2002).

4.特纳,M。思想的起源:融合、创造力和人类火花牛津大学出版社(2014)。

5.福康尼尔,G.和特纳,M。《我们思考的方式:概念融合和思维隐藏的复杂性》(The Way We Think: Conceptual Blending and The Mind’s Hidden complexity)《基础图书》,纽约,纽约(2002年)。

6.米勒,A.I。天才的洞察力:科学与艺术中的意象与创造力麻省理工学院出版社(1996)。

7.G.-C轮值表。和Palombi, F。胡思乱想Birkhảuser Boston(1997年)。

8.关于形状原型在视觉分层模型中的作用。2013年国际神经网络联合会议1-6(2013)。

9盖利,S。,计算机围棋的巨大挑战:蒙特卡罗树搜索和扩展。ACM的通信55, 106-113 (2012).

15条评论-加入讨论