阿尔法狗登顶“棋王”后 AI扑克牌手杀也来了
在AlphaGo(阿尔法狗)冲进围棋世界,疯狂碾压人类高手之后,人工智能(AI)又杀入了新的领域——德州扑克。
卡内基梅隆大学研发了一款名为“冷扑大师”的扑克比赛机器人。在近日于中国海南举行的德州扑克人机大战中,历经五天的比赛和36000手对阵之后,“冷扑大师”最终以792,327的筹码获胜,赢得了29万美元的奖金。
“冷扑大师”的对手方是名为龙之队的人类德扑牌手。这支队伍是由2016年世界德州扑克大赛WSOP金手链获得者、前人人网副总裁杜悦领头,组员有许朝军、张淮、童舟、朱亚希等六位资深华人德扑牌手。
这并非机器人首次赢得德扑比赛的胜利。“冷扑大师”的前身是Libratus,这款机器人曾于1月在匹兹堡的120000手无上限德扑一对一比赛中击败四名*扑克玩家,赢得170万筹码,每百手胜率超过14个大盲。
去年,另一个叫作DeepStack的扑克机器人在与11名人类玩家的无限注德扑一对一对战中,打败了10人。这个AI机器人由阿尔伯塔大学、布拉格捷克理工大学和布拉格查理大学的计算机科学家们联合研制。
“冷扑大师”创造者之一、卡内基梅隆大学计算机科学教授Tuomas Sandholm说:“我希望探索人工智能在扑克以及其他应用领域里各种不同的商业机会。”
“冷扑大师”与AlphaGo的异同
从技术角度来说,德扑与围棋不同之处在于,围棋是“完全信息博弈”,通过观察棋盘,就能立刻知道博弈所处的完整状态。而德扑则是一种“不完全信息博弈”。
和人类一样,“冷扑大师”在翻牌前只能看到自己的牌,它必须自己算牌,根据出牌序列、对手风格、对手位置和筹码深度等等因素来反推对手手中的牌,从而计算各自的胜率。而且,在德扑比赛中,运气是个关键因素。
杜悦评价道:“冷扑大师的出牌全部基于科学的计算。而且,冷扑大师永远理性。不能保持头脑冷静却是人类选手的最大缺陷。”
海南人机大战发起者、创新工场董事长兼CEO李开复表示,和人工智能玩德州扑克,人类代表队预期的胜算率是10%。
正如与AlphaGo对阵的李世石所说,“人会有心理上的摇摆,即使知道准确的答案,在下子那一刻还是有可能会选择另一条路, 考虑其他的选择。但AlphaGo不会有任何动摇,这就是我所面对的最大困难。”
李世石甚至表示:“面对毫无感情的对手是非常难受的事情,这让我有种再也不想跟它比赛的感觉。”他承认,如果再有机会跟AlphaGo对弈,情况一定也会非常艰难。
德扑AI技术尚未成熟
目前来看,虽然AlphaGo在围棋界已经算得上大师级别,但能够对弈扑克的AI技术还远谈不上成熟。
杜悦表示,必须弄清楚的是,龙之队和冷扑大师的对战形式是一对一,最后计算累计成绩。在现实生活中,徳扑是多人游戏,而眼下AI还玩不转多人形式。“跟单挑相比,多人游戏在计算复杂度上不是一个量级的,而是指数级的增长。所以,在可预见的未来,我们应该不会看到最顶尖的机器人在多人桌上出现。”
但他同时还称,人工智能一旦能够战胜人类*玩家,就证明它的理论和模型是对的,在成熟的AI面前,“人类没有丝毫的胜算” 。
“人工智能的到来不可避免。人机共存时代,人类会和机器互相帮助,也会互相竞争。”
上一篇: java xml解析之dom解析