O.ver今年年初20天的跨度,人工智能遇到了对现实世界中可能解决问题的重大考验。一个名为Libratus的程序采用了该国最好的扑克玩家,在河流赌场锦标赛在宾夕法尼亚州匹兹堡。他们正在玩扑克牌的形式称为单挑无限额德州扑克,其中两名球员面临下岗,经常上网,在一长串的手,试探对方的战略,完善自己,吓唬疯狂。经过12万手,Libratus出现了压倒性的胜利,在所有四个对手,获胜的模拟资金1776250 $,更重要的,吹牛的权利,可以说是这个星球上最好的扑克玩家。只需一半的比赛中,董金,谁表现最好的对机器的人的球员,但都不服输。“我不知道它有多好直到今天。我觉得我是打对人谁在欺骗,像它可以看到我的卡,”他告诉有线.“我没有指责作弊的吧。这只是好“。
Plibratus的成功是对创造它的物种的人工智能的另一个胜利。当计算机掌握Tic-Tac-Toe和Checkers的相对琐碎的游戏时,除了计算机科学家之外的任何人都会受到很多关注。但是,在1997年,当我的深蓝色击败象棋兰德·卡里卡罗夫(Chess Grandmaster Garrymaster Kasparov)时,一场Geniuses致力于他们的生命,越来越感兴趣,而且担心智能电脑如何成为智能电脑。最近的改进了。已经越来越快:2011年,I.B.M.的沃特森最伟大的(人)冒险!就在去年,一个名为AlphaGo的程序打败了世界上最好的围棋选手之一李世石前10年许多研究人员预期HOMO SAPIENS.失去上出了名的复杂的游戏我们的束缚。
Libratus给了我们诱人的想法,计算机处理复杂和重要的问题比我们更好。
扑克似乎只是人工智能前进的又一步(如果你相信科幻小说的话,它会朝着反乌托邦的全球主导地位的方向前进),但它可能是最重要的一步。不像其他游戏,扑克是一种不完全信息游戏.在国际象棋和去,你知道你的作品和你的对手是在哪里,你从那种明确的职位开始前进;在扑克中,你不知道你的对手持有什么牌,你必须在这种不确定性的漩涡中做出决定。研究人员称,这是更困难的,可以说,更重要的是,因为许多重要的决定是基于不完整的信息。医生看着患者,聚集他们可以的证据,并使生命或死亡的决定常常不知道身体内部真正发生的事情。外交官,商业谈判者和军事战略家不知道其同行的真实职位或意图,并必须根据可能的行动和结果的复杂网格制定战略。
为了A.I.研究人员,扑克节目不只是更好的方法来赢得一个纸牌游戏:他们的实验,看看如何好电脑可以使信息不完善的决策。几十年来,他们一直在改善他们的比赛计划,试图以匹配目前的基准:我们。图奥马斯桑德霍尔姆,Libratus的创造者和卡内基·梅隆大学的计算机科学家,已经摔扑克12年。他以前的创作,Claudico,在阿尔伯塔大学失去了四个扑克高手类似的比赛在2015年一个研究小组日前宣布,他们的计划,称为DeepStack,是第一个被击败职业球员单挑,无限额德州扑克,但在赌场参加比赛说比赛不一样猛。现在,电脑已经证明他们可以比人更好地玩扑克,他们可能准备使用的技能比我们做出更好的真实世界的决策。
创建一个足够聪明的程序需要聪明的方法;Sandholm依靠一种称为强化学习的技术。他和他的学生教书了比赛的规则,让它赢得了赢钱的简单目标,然后让它播放万亿手反对本身,努力跌跌撞撞的任何动作。该计划观看了什么工作,没有使用这些观察来制定自己的战略。这样做的一个明显优势是,Libratus并不局限于其他扑克玩家开发的策略,有时它还会想出自己的、违反直觉的动作。例如,当Libratus持有弱牌而对手提高赌注时,程序有时会立即提高赌注。这似乎有些鲁莽,因为这增加了弱牌输给强势牌对手的几率。“如果我10岁的女儿做出这种举动,我会教她不要这样做,”桑德霍尔姆告诉这华盛顿邮报》.“但事实证明,这实际上是一个很好的举动。它有助于抓住虚张声势。”也就是说,如果下注的对手是在虚张声势,他们可能会被Libratus的反注吓到,认为程序有很强的优势,然后就会认输。Libratus发现可以用更大的虚张声势来战胜虚张声势。
人工智能领域最近取得的许多著名进展,如自动驾驶汽车、面部识别和自然语言处理,都依赖于另一种被称为机器学习的方法,即计算机研究庞大的数据集,并从它们看到的模式中得出结论。相反,强化学习可能更善于让电脑产生自己的创造性策略。如果这是真的,那么Libratus和AlphaGo都使用强化学习来发展它们超越人类的技能就不是巧合了。
Libratus让我们想到计算机处理复杂和重要问题的能力比我们以往任何时候都强,但这项技术发展得如此之快,以至于它何时、如何或是否会成功应用尚不清楚。在短期内,该项目本身甚至不会对其自然栖息地构成太大威胁。Libratus在一次只对一个对手的扑克游戏中占主导地位;如果移动到一张满是玩家的桌子上,计算就会更加复杂,Libratus就会超出它的深度。即使在一对一的在线游戏中,Libratus对计算的要求也非常高(它跑了超级计算机,并使用超过7,000倍的加工功率和高端笔记本电脑的RAM的17,000倍),使用它超出了研究是不想如的。目前,该计划正在以不同的方式改变扑克世界,通过学校人类参加人工。“我们肯定会从这台电脑的想法中学习,”说过杰森莱斯,由机器征服的球员之一。“我想我会来的这更好的扑克选手了。”
Amos Zeeberg是一家位于东京的自由职业者科学和技术记者。
最新,最流行的文章向您的收件箱交付了!
看:Ken Goldberg是U.C的自动化科学实验室的机器人。伯克利,在机器人曾经做过的最具创造力的事情上。