围棋之后 人工智能下次突破哪个领域
经过2小时,4小时训练后,DeepMind的水平已经超过职业玩家。(01:32)
澎湃新闻记者 王心馨
3月10日,谷歌AlphaGo与李世石的第二场对局已落下帷幕。2:0,在五番棋中,李世石已命悬一线。
在棋类竞技中,围棋作为人类智能最后一个未被人工智能征服的堡垒,正在AlphaGo的进攻下逐渐沦陷。
凭借着DeepMind公司为它武装的四大利器——走棋网络(Policy Network)、快速走子(Fast rollout)、估值网络(Value Network)以及蒙特卡罗树搜索(Monte Carlo Tree Search),AlphaGo正在围棋领域攻城拔寨,锐不可当。
这样的剧情走向看起来有点像1997年,IBM“深蓝”与国际象棋大师卡斯帕罗夫的对决。但是,这两者之间有着巨大的不同:“深蓝”采用的是“暴力算法”,而AlphaGo要聪明得多。比起只能下国际象棋的深蓝,AlphaGo拥有更大的潜力,只要涉及到策略分析,AlphaGo几乎所向披靡。
深蓝下棋无敌,但只是下棋
先让我们回顾下1997年的那场“人机对弈”。
1997年5月,国际象棋棋王卡斯帕罗夫在第二次对决IBM研发的深蓝电脑时,以3.5:2.5败于机器手下。此事震动了全世界,一时间“AI战胜人类”的话题不绝于耳。
但后来有科学家发现,“深蓝”的技术并不全面,它太专业了。换言之,深蓝是专门为国际象棋设计的。它评估盘面的四项标准包括子力、棋子位置、王的安全性还有布局节奏——显然,这些指标完全依赖于国际象棋本身的规则,没有任何扩展性。
作为一台超级国际象棋电脑,深蓝重1270公斤,有32个大脑(微处理器),每秒钟可以计算2亿步,计算能力11.38 GFLOPS,输入了一百多年来优秀棋手的对局两百多万局。这样的计算能力放到现在,还没有你我手中智能手机的CPU性能强。
此外有媒体报道称,当时,深蓝在棋局之间还曾被修改以符合卡斯帕罗夫的下棋风格,以免再次跌入陷阱(卡斯帕罗夫曾赢过深蓝)。
因此,将深蓝称为人工智能是不合适的,它更像是一个专门用来下国际象棋的程序。想让它学会围棋、五子棋,或者画画是不可能的。
AlphaGo开启通用模式后可应用到更多领域
但AlphaGo不一样。从这两天的比赛来看,人类似乎低估了AlphaGo的学习能力。尤其是3月10日的比赛,就连众多职业九段围棋高手都没能判断出AlphaGo一招看似业余的走法,其背后却已暗藏杀机。
AlphaGo能拥有如此巨大的威力,主要是得益于背后的深度学习、强化学习和蒙特卡罗树搜索方法。值得一提的还有,这些算法并非只能用在AlphaGo的围棋项目。这也让AlphaGo的未来充满想象。
在DeepMind创始人德米斯·哈萨比斯(Demis Hassabis)和他的团队搭建AlphaGo之前,已经使用这些技术做了一些会玩经典雅达利视频游戏(比如,Pong,Breakout以及Space Invaders)的DEMO系统。在这些案例中,这些系统不仅比职业玩家还出色,它们还会以天马行空的方式玩游戏,没有人类玩家会或者可以这么玩。
“DeepMind的做法是,不告诉机器哪种算法能得到高分,而是训练它,通过学习和分析结果来判断最优策略。”复旦大学计算机与工程学院副教授邱锡鹏告诉澎湃新闻(www.thepaper.cn)。
从小游戏到围棋对弈,谷歌还打算将AlphaGo背后的算法一步步地运用到更多的领域中。就在3月份与李世石开赛前,DeepMind公司就公开表示,将与伦敦帝国理工学院和伦敦皇家*医院展开合作,试图将其人工智能技术应用于医疗行业。
除了医疗外,金融交易公司以及投资机构也对AlphaGo背后的算法展现出了浓厚的兴趣。
英国大型投资公司英仕曼(AHL Man)首席科学家安东尼莱德福(Anthony Ledford),在去年12月举行的蒙特利尔人工智能研究者的重要学术活动NIPS会议(神经信息处理系统进展大会)上表示,公司正在探索是否深度学习技术会有助于融资。
“这是早期阶段,”莱德福说,“我们已经拨出大量资金用于测试交易。如果一切顺利,深度学习将进入测试交易。”
对于人类生活而言,需要最优策略路径选择的,不单只是游戏或者金融交易这些领域。随着算法越来越精妙,或许在未来的某一天,大家可以看到人工智能在军事领域里的运用。其实,围棋何尝不是一场抽象的战争?