欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

围棋之后 人工智能下次突破哪个领域

程序员文章站 2022-04-24 16:52:52
经过2小时,4小时训练后,DeepMind的水平已经超过职业玩家。(01:32)澎湃新闻记者 王心馨3月10日,谷歌AlphaGo与李世石的第二场对局已落下帷幕。2:0,在五番棋中,李世石已命悬一线。...

经过2小时,4小时训练后,DeepMind的水平已经超过职业玩家。(01:32)

澎湃新闻记者 王心馨

3月10日,谷歌AlphaGo与李世石的第二场对局已落下帷幕。2:0,在五番棋中,李世石已命悬一线。

在棋类竞技中,围棋作为人类智能最后一个未被人工智能征服的堡垒,正在AlphaGo的进攻下逐渐沦陷。

凭借着DeepMind公司为它武装的四大利器——走棋网络(Policy Network)、快速走子(Fast rollout)、估值网络(Value Network)以及蒙特卡罗树搜索(Monte Carlo Tree Search),AlphaGo正在围棋领域攻城拔寨,锐不可当。

这样的剧情走向看起来有点像1997年,IBM“深蓝”与国际象棋大师卡斯帕罗夫的对决。但是,这两者之间有着巨大的不同:“深蓝”采用的是“暴力算法”,而AlphaGo要聪明得多。比起只能下国际象棋的深蓝,AlphaGo拥有更大的潜力,只要涉及到策略分析,AlphaGo几乎所向披靡。

深蓝下棋无敌,但只是下棋

先让我们回顾下1997年的那场“人机对弈”。

1997年5月,国际象棋棋王卡斯帕罗夫在第二次对决IBM研发的深蓝电脑时,以3.5:2.5败于机器手下。此事震动了全世界,一时间“AI战胜人类”的话题不绝于耳。

但后来有科学家发现,“深蓝”的技术并不全面,它太专业了。换言之,深蓝是专门为国际象棋设计的。它评估盘面的四项标准包括子力、棋子位置、王的安全性还有布局节奏——显然,这些指标完全依赖于国际象棋本身的规则,没有任何扩展性。

作为一台超级国际象棋电脑,深蓝重1270公斤,有32个大脑(微处理器),每秒钟可以计算2亿步,计算能力11.38 GFLOPS,输入了一百多年来优秀棋手的对局两百多万局。这样的计算能力放到现在,还没有你我手中智能手机的CPU性能强。

此外有媒体报道称,当时,深蓝在棋局之间还曾被修改以符合卡斯帕罗夫的下棋风格,以免再次跌入陷阱(卡斯帕罗夫曾赢过深蓝)。

因此,将深蓝称为人工智能是不合适的,它更像是一个专门用来下国际象棋的程序。想让它学会围棋、五子棋,或者画画是不可能的。

AlphaGo开启通用模式后可应用到更多领域

但AlphaGo不一样。从这两天的比赛来看,人类似乎低估了AlphaGo的学习能力。尤其是3月10日的比赛,就连众多职业九段围棋高手都没能判断出AlphaGo一招看似业余的走法,其背后却已暗藏杀机。

AlphaGo能拥有如此巨大的威力,主要是得益于背后的深度学习、强化学习和蒙特卡罗树搜索方法。值得一提的还有,这些算法并非只能用在AlphaGo的围棋项目。这也让AlphaGo的未来充满想象。

在DeepMind创始人德米斯·哈萨比斯(Demis Hassabis)和他的团队搭建AlphaGo之前,已经使用这些技术做了一些会玩经典雅达利视频游戏(比如,Pong,Breakout以及Space Invaders)的DEMO系统。在这些案例中,这些系统不仅比职业玩家还出色,它们还会以天马行空的方式玩游戏,没有人类玩家会或者可以这么玩。

“DeepMind的做法是,不告诉机器哪种算法能得到高分,而是训练它,通过学习和分析结果来判断最优策略。”复旦大学计算机与工程学院副教授邱锡鹏告诉澎湃新闻(www.thepaper.cn)。

从小游戏到围棋对弈,谷歌还打算将AlphaGo背后的算法一步步地运用到更多的领域中。就在3月份与李世石开赛前,DeepMind公司就公开表示,将与伦敦帝国理工学院和伦敦皇家*医院展开合作,试图将其人工智能技术应用于医疗行业。

除了医疗外,金融交易公司以及投资机构也对AlphaGo背后的算法展现出了浓厚的兴趣。

英国大型投资公司英仕曼(AHL Man)首席科学家安东尼莱德福(Anthony Ledford),在去年12月举行的蒙特利尔人工智能研究者的重要学术活动NIPS会议(神经信息处理系统进展大会)上表示,公司正在探索是否深度学习技术会有助于融资。

“这是早期阶段,”莱德福说,“我们已经拨出大量资金用于测试交易。如果一切顺利,深度学习将进入测试交易。”

对于人类生活而言,需要最优策略路径选择的,不单只是游戏或者金融交易这些领域。随着算法越来越精妙,或许在未来的某一天,大家可以看到人工智能在军事领域里的运用。其实,围棋何尝不是一场抽象的战争?