事实如此浪漫

再见,图灵测试;来参加图灵十项全能吧

雕刻家斯蒂芬·凯特尔的艾伦·图灵雕像完全由石板片制成。这座雕像描绘了图灵在一台谜语机器上工作的情景,纳粹用这台机器对信息进行编码。这座雕像位于英国政府所在地布莱切利公园,图灵及其同事在那里破译了密码。 Richard Gillin通过Flickr拍摄的照片

H改变人工智能测试需要多少研究人员?

六十五年前,著名数学家和二战密码破译家艾伦·图灵揭幕“模仿游戏”,一个有趣的场景,用来测试计算机伪装成人类代理的能力。图灵描述的模仿游戏就像经典的游戏秀说实话在这本书中,两个人做出了相同的声明,比如“我是纽约市的一名出租车司机”,一位面试官向他们提问,以确定两人中谁在撒谎。在图灵的版本中,两位受访者中的一位被电脑取代。

从那以后,图灵的初衷是检验机器是否会思考的哲学问题,但在其他人的头脑中却演变成了“图灵测试”,这是对机器性能的一个模糊阈值的简称,超过这个阈值,机器就可能被称为“智能”。

2014年夏天,一个名为尤金·古斯特曼(Eugene Goostman)的聊天机器人程序被广泛报道通过了图灵的测试当它与类似的程序竞争,并说服大多数人,他们是在与人聊天,而不是电脑。但领先的人工智能研究人员显然并不信服。很多人说,Goostman机器人并没有真正通过图灵测试——它只能用拐杖在简短的对话中欺骗三分之一的人类面试官:它假装自己是一个13岁的乌克兰男孩,英语掌握得不太好。心理学家加里•马库斯(Gary Marcus)表示,与任何智能机器的问世相比,机器人的成就更多地在于我们有多容易被愚弄。

更重要的是,许多研究人员表示,测试背后的整个想法是有缺陷的,分散了人们对更重要问题的注意力。多亏了Goostman,油田内原本平静的暗流迅速溢出堤岸,最终在一次地震中流入德克萨斯州奥斯汀的河边酒店会议室上个月的人工智能会议. 在这里,大约50名计算机科学家、机器人学家、语言学家、心理学家和神经科学家齐聚一堂,为人工智能开辟新的道路,许多人呼吁废除久负盛名的图灵测试,转而采用新的一系列测试,他们希望能更准确地测量人类和机器智能,并最终激发更多有用的研究。

马库斯是纽约大学的一名教授,也是最近会议的组织者,他帮助将专家们的怀疑集中到了对Goostman表面上的胜利的关注上。“我们都看到图灵测试在公众的想象中占据了中心位置,”马库斯说,“但我们每个人都认为这是一个非法的测试,而且这对人工智能来说是一个糟糕的目标。”

图灵测试最大的缺点可能也是它如此出名的原因:它的简单性。人工智能公司Cycorp的首席执行官、前斯坦福大学教授Doug Lenat说:“我认为图灵测试的真正问题在于,它只测试了人类智能的一小部分。”勒纳特和他的同事投入了更多的资金霍华德·加德纳的《多元智能理论》它将认知能力从一般特征划分为一系列特定的能力。而像IBM这样的计算机危险莱纳特说,真正的智能机器需要反映人类智能的各个方面。小组一致认为,评估这些不同的智能需要不同的测试,最后他们勾画了几种图灵测试的替代方案。

“我们都看到图灵测试在公众的想象中占据着中心位置,但我们在座的每一个人都认为这是一个非法的测试,对人工智能来说是一个糟糕的目标。”

现在最完善的测试要求计算机计算常识“语言。请考虑以下句子:

市议会拒绝给示威者颁发许可证,因为他们害怕/鼓吹暴力。

如果这个词是“害怕的”,那么代词“他们”指的是“市议会”。如果选择的词是“提倡的”,代词的意思就会转移到“示威者”。像这样的句子,被称为Winograd schema,对我们来说很容易破译,但目前计算机是不可能破译的。的Winograd模式的挑战该项目由人工智能公司Nuance Communications赞助,将在今年晚些时候邀请团队参赛。

由斯坦福大学的李飞飞领导的第二项测试将要求计算机破译图像和视频的含义。搜索引擎目前无法索引网络的视觉媒体,除非它伴有文本描述;智能计算机视觉将把这些数字暗物质带入光明。另一种则是挑战像沃森这样的机器,让其超越危险回答小学标准化考试的问题,或许还能用这些知识来指导人类学生。

第四个、或许也是最雄心勃勃的提议被戏称为“宜家挑战”。这听起来可能像是一个糟糕的、由公司赞助的真人秀节目,但这个测试旨在测试机器人在与人类进行肢体合作时破译语言的能力。这意味着解读书面说明,选择正确的部件,并把它放在合适的位置,让人类队友转动螺丝钉。天网显然是一件瑞典家具。马库斯认为,随着这些测试的结合和新测试的开发,智能机器可能有一天会被要求参加“图灵十项全能”比赛。

那么电脑还要多久才能达到我们的水平呢?这个小组明智地避免了这样的预测,但哈佛大学(Harvard)和意大利帕多瓦大学(University of Padova)的计算机科学教授弗朗西斯卡·罗西(Francesca Rossi)表达了一种谦逊的情绪,这种情绪在整个研讨会上回荡。谈到人类智能,罗西说:“我认为我们对大脑和思维的了解还不足以确切地知道它是什么。”考虑到我们有限的自我理解,很难说电脑什么时候能与我们匹敌。

该小组将在今年晚些时候再次召开会议,继续完善新的测试方法。目前还没有关于艾伦·图灵是否被邀请的消息。


有关更新和更多信息,访问“超越图灵测试”研讨会网站


乔·汉森博士。是PBS数字工作室的创始人YouTube系列和网站”聪明也没关系他也为科学美国人《连线》杂志,他的作品曾被刊登在开放实验室:最佳科学写作在线. 他住在德克萨斯州的奥斯汀。

1评论-加入讨论