围棋之后人工智能下次突破哪个领域

程序员文章站 2022-07-27 11:11:02

经过2小时，4小时训练后，DeepMind的水平已经超过职业玩家。(01:32)澎湃新闻记者王心馨3月10日，谷歌AlphaGo与李世石的第二场对局已落下帷幕。2:0，在五番棋中，李世石已命悬一线。...

经过2小时，4小时训练后，DeepMind的水平已经超过职业玩家。(01:32)

澎湃新闻记者王心馨

3月10日，谷歌AlphaGo与李世石的第二场对局已落下帷幕。2:0，在五番棋中，李世石已命悬一线。

在棋类竞技中，围棋作为人类智能最后一个未被人工智能征服的堡垒，正在AlphaGo的进攻下逐渐沦陷。

凭借着DeepMind公司为它武装的四大利器——走棋网络（Policy Network）、快速走子（Fast rollout）、估值网络（Value Network）以及蒙特卡罗树搜索（Monte Carlo Tree Search)，AlphaGo正在围棋领域攻城拔寨，锐不可当。

这样的剧情走向看起来有点像1997年，IBM“深蓝”与国际象棋大师卡斯帕罗夫的对决。但是，这两者之间有着巨大的不同：“深蓝”采用的是“暴力算法”，而AlphaGo要聪明得多。比起只能下国际象棋的深蓝，AlphaGo拥有更大的潜力，只要涉及到策略分析，AlphaGo几乎所向披靡。

深蓝下棋无敌，但只是下棋

先让我们回顾下1997年的那场“人机对弈”。

1997年5月，国际象棋棋王卡斯帕罗夫在第二次对决IBM研发的深蓝电脑时，以3.5：2.5败于机器手下。此事震动了全世界，一时间“AI战胜人类”的话题不绝于耳。

但后来有科学家发现，“深蓝”的技术并不全面，它太专业了。换言之，深蓝是专门为国际象棋设计的。它评估盘面的四项标准包括子力、棋子位置、王的安全性还有布局节奏——显然，这些指标完全依赖于国际象棋本身的规则，没有任何扩展性。

作为一台超级国际象棋电脑，深蓝重1270公斤，有32个大脑（微处理器），每秒钟可以计算2亿步，计算能力11.38 GFLOPS，输入了一百多年来优秀棋手的对局两百多万局。这样的计算能力放到现在，还没有你我手中智能手机的CPU性能强。

此外有媒体报道称，当时，深蓝在棋局之间还曾被修改以符合卡斯帕罗夫的下棋风格，以免再次跌入陷阱（卡斯帕罗夫曾赢过深蓝）。

因此，将深蓝称为人工智能是不合适的，它更像是一个专门用来下国际象棋的程序。想让它学会围棋、五子棋，或者画画是不可能的。

AlphaGo开启通用模式后可应用到更多领域

但AlphaGo不一样。从这两天的比赛来看，人类似乎低估了AlphaGo的学习能力。尤其是3月10日的比赛，就连众多职业九段围棋高手都没能判断出AlphaGo一招看似业余的走法，其背后却已暗藏杀机。

AlphaGo能拥有如此巨大的威力，主要是得益于背后的深度学习、强化学习和蒙特卡罗树搜索方法。值得一提的还有，这些算法并非只能用在AlphaGo的围棋项目。这也让AlphaGo的未来充满想象。

在DeepMind创始人德米斯·哈萨比斯（Demis Hassabis）和他的团队搭建AlphaGo之前，已经使用这些技术做了一些会玩经典雅达利视频游戏（比如，Pong，Breakout以及Space Invaders）的DEMO系统。在这些案例中，这些系统不仅比职业玩家还出色，它们还会以天马行空的方式玩游戏，没有人类玩家会或者可以这么玩。

“DeepMind的做法是，不告诉机器哪种算法能得到高分，而是训练它，通过学习和分析结果来判断最优策略。”复旦大学计算机与工程学院副教授邱锡鹏告诉澎湃新闻（www.thepaper.cn）。

从小游戏到围棋对弈，谷歌还打算将AlphaGo背后的算法一步步地运用到更多的领域中。就在3月份与李世石开赛前，DeepMind公司就公开表示，将与伦敦帝国理工学院和伦敦皇家*医院展开合作，试图将其人工智能技术应用于医疗行业。

除了医疗外，金融交易公司以及投资机构也对AlphaGo背后的算法展现出了浓厚的兴趣。

英国大型投资公司英仕曼（AHL Man）首席科学家安东尼莱德福（Anthony Ledford），在去年12月举行的蒙特利尔人工智能研究者的重要学术活动NIPS会议（神经信息处理系统进展大会）上表示，公司正在探索是否深度学习技术会有助于融资。

“这是早期阶段,”莱德福说，“我们已经拨出大量资金用于测试交易。如果一切顺利，深度学习将进入测试交易。”

对于人类生活而言，需要最优策略路径选择的，不单只是游戏或者金融交易这些领域。随着算法越来越精妙，或许在未来的某一天，大家可以看到人工智能在军事领域里的运用。其实，围棋何尝不是一场抽象的战争？

上一篇：睡和垂的对话

下一篇：职场幽默

围棋之后 人工智能下次突破哪个领域