欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

人机合体?从AlphaGo窥探人工智能的进化轨迹

程序员文章站 2022-04-29 14:07:47
5月19日消息,借着谷歌IO大会的东风,《连线》杂志发文深入剖析AI向人类进化的整个过程。以下为文章主要内容:黄士杰的手从黑色的棋盒中摸出了一个黑子,不过他并没有转移他的视线,棋子在他的大拇指和食指之...

5月19日消息,借着谷歌IO大会的东风,《连线》杂志发文深入剖析AI向人类进化的整个过程。以下为文章主要内容:

黄士杰的手从黑色的棋盒中摸出了一个黑子,不过他并没有转移他的视线,棋子在他的大拇指和食指之间徘徊。最后,他把黑子落在棋盘一个很空的区域。棋盘对面,李世石-过去十年中最好的棋手,凝神屏息。他看着37手的落子,然后站起来就离开了。

在解说室,迈克尔·雷德蒙是通过闭路电视观看了这场比赛。雷德蒙,西方唯一的九段棋手,所得到的震撼并不亚于李世石本人。 “我真的不知道这是一步好棋还是坏棋。” 当时有近200万人观看了比赛。

美国围棋协会通讯副总裁英语解说员克里斯·加洛克表示,“我认为这是一个错误。”

几分钟后,李世石回到比赛房间。一分钟过去了,接着又过去了十五分钟。最后,李世石将白子落在了黄士杰所落黑子的旁边。但李世石并没有从打击中恢复过来。四小时二十分钟后,他败下阵来。

但黄士杰并不是这场比赛的真正赢家。他只是奉命行事,传达人工智能旨意的傀儡,黄士杰身旁的电子屏幕链接了数百个分布在世界各地的谷歌数据中心,人们把它命名AlphaGo。它击败了可能是有史以来人类设计的最复杂的游戏中最好的选手。

在同一房间,另一围棋高手手三次欧洲冠军樊麾也在注视着比赛。首先,李世石的第37手同样让他产生了疑惑。但他与AlphaGo的纠葛比其他任何人类都多,他是AlphaGo的陪练。五个多月,他与AlphaGo进行了上百盘比赛。它一天天看着他长大,他的失败次数越来越多,但他是最了解AlphaGo的人。和其他人一样都做不到。看着AlphaGo的第37子落地,他觉得这不是常人的举动,但琢磨10秒后,他表示, “太妙了,如此精妙。”

在五场比赛中,AlphaGo获得压倒性胜利。第37手表明AlphaGo不只是有程序堆砌用运算进行预测。当下AlphaGo证明它可以理解围棋,或者至少能够表现出某种理解围棋的能力,就好像真正的棋手一样。李世石坐在对面,AlphaGo显示了棋手通常称为棋感的东西。不仅像人一样下棋,甚至超出常人。第37步具有历史意义,机器和人类终于开始有了真正融合的一天。

人机合体?从AlphaGo窥探人工智能的进化轨迹

David Silver是AlphaGo团队的领军人物

哈萨比斯1976年生于伦敦,母亲是新加坡华侨,父亲是希腊裔塞浦路斯人。他4岁开始接触国际象棋,聪敏的天资早已表露无遗,小小年纪就在国内外比赛屡获殊荣,13岁晋身「大师级」(chess master),在14岁以下棋手中名列世界第二,仅次被喻为史上最强女棋手、匈牙利的波尔加尔(Judit Polgár)。

哈萨比斯8岁时以象棋比赛奖金买下一部Spectrum电脑,靠看书及杂志学懂编写程式,兴趣亦渐渐由棋盘转至电脑。哈萨比斯16岁完成A- Level考试获剑桥大学取录,趁休学年加入英国Bulldog制作公司,变身录像游戏设计师。由他操刀设计及编写程式的模拟管理游戏《主题公园》 (Theme Park)大受欢迎,销量数百万。

重返校园在剑桥攻读电脑后,哈萨比斯对AI的兴趣日浓,立志投身其中,更以棋手一贯的深谋远虑,谋定20年大计,一步步向着梦想进发。他毕业后先创立游戏开发公司Elixir Studio,学习创业营商之道;28岁在伦敦大学学院(UCL)攻读认知神经科学博士课程,主力研究脑部负责导航、回忆及想像的海马回(hippocampus) ,为打造思考方式更近似人类的电脑铺路,他提出的新理论更获《科学》杂志选为2007年十大科技突破。

1997 年,当 IBM 深蓝电脑击败国际象棋冠军的那一刻,正好是 Demis 在剑桥大学攻读电脑科学的时候,在剑桥内第一次接触到围棋-这个已有千年历史的棋类运动。 Demis 回忆,当时看到这场比赛内心萌生很多想法,也让他下定决心,有一天要做出一个下围棋胜过人类的电脑系统。

游戏,就是他探索这个宇宙的第一步。早在 17 岁时,Demis 就曾制作过一套名为主题公园(Theme Park)的模拟游戏,全球销售超过百万套。离开剑桥后,Demis 创办了电子游戏公司 Elixir Studios,10 年后他重回校园,在伦敦大学完成认知神经科学博士学位,也在麻省理工和哈佛大学从事博士后研究。

做为一个神经科学家、电脑科学家和国际象棋神童。 2010 年,它与 Shane Legg、Mustafa Suleyman 两人共同创办了 DeepMind。在 DeepMind 官网首页,他们这么写下公司宗旨:“解构智慧,用它来让世界更好。”AlphaGo,就是 DeepMind 跨入 AI 领域的重要一步,这一步,世界瞩目,但即使 AlphaGo 证明自己能够胜过人脑,大家感到期待、惊讶,隐而未显的却是更多对于未来的恐惧。

对于人工智慧的发展,持反对意见的科技意见领袖不少,包括特斯拉的马斯克、科学家史蒂芬霍金都是知名的反对派,霍金更曾语出惊人一句人工智慧将使人类灭绝。人们害怕的是人工智能会不会有一天懂得思考?会不会铺天盖地控制我们的生活?

但Demis表示,我不觉得 AI 是个威胁,我觉得他很令人惊奇!相较于媒体询问到任何有关 AlphaGo 的技术细节,Demis 总能细细的、不厌其烦的解释。他在讲这一句话的时候,语气特别加重了些。

在 Demis 眼中,AI 并不是用来取代人类,AI 终归是一项工具,意在让人类的生活进步。机器不会有喜、不会有怒,当然也不会感到疲惫,机器可以不间断的进行运算,在数以百万计的数据资料中,找出最有价值的一个。运用在医疗、科学领域,都能带来极大的帮助,但人类的思想、好奇、想像,才是创造出这一切的根本。AlphaGo 在围棋中胜过人类,但不代表它能够知道或是理解自己正在做些什么,要从机器学习进步到机器理解,还有非常长的距离,让机器能像人脑一样理解,也不会是DeepMind 未来要做的。

所以,Demis 如何想像未来 5 年有 AI 的世界? “我觉得其实不会有什么太大的改变,可能你的手机、你的家庭用品更理解你的使用行为了,也或许无人车满街跑了,但如果说是什么天翻地覆的改变,我觉得不会。”

人机合体?从AlphaGo窥探人工智能的进化轨迹

DeepMind创始人Demis Hassabis

没人会拿6.5亿美金建造只会下棋的机器,深度学习和神经网络已经深入谷歌的各种服务。AlphaGo和以往那些会下棋的机器人的区别在于,他不是被设计出来专门下棋的,他是来“学习”下棋的——这是一个有着“深度学习”功能的机器人,他的使命在于模仿人类的思维进行学习。

换句话说,他今天可以学下棋,明天就可以学写歌。其次,传统的会下棋的机器人是根据一步棋子带来的所有的可能性来布局的,导出所有可能的结果,再往前推“当前这一步该怎么走”,但是这在围棋上是不可行的。

围棋每回合的可能性可达250种,一盘棋可以长达150回,总共有3^361 种局面,而我们目前可观测到的宇宙,原子数量才10^80,所以根本不可能逆推计算。所以这就是AlphaGo机器人最厉害的地方,他不是一个机械的编码程序,他有一个“监督预判机制”,每走一步,他会考虑这种走法是不是更有前途,这是一种类似“想象力”的能力。

这种思维模式,几乎和人类的直觉类似,使得他前所未有地更加像人类。一直以来,外界普遍认为利用人工智能超越围棋专业选手至少需要10年。

韩国围棋九段棋手李世石与 Google 人工智能程序 AlphaGo 之间的“人机对弈”展开第四局,在近五个小时的激战之后,李世石最终扳回一局,取得首胜。李世石称 AlphaGo 的程序虽然表现惊人,但也展现出弱点。而外界也期望李世石能在余下两局为人脑挣回一些面子。出战第四局时,李世石进场时神情较前几天轻松。但在对弈开始后,手执白子的李世石不断陷入长时间思考,而且逐渐落入下风。

战至中盘,AlphaGo 的思考时间比李世石足足用少近1小时,一些直播评论甚至认为已经看不到李世石有逆转的希望。眼看李世石即将进入每一手必须在60秒内落子的“读秒”阶段,令形势更加不利,但他却妙招频出,尤其于第78手下了一子妙棋,成功令僵局现出生机,并能逐步串连起占据棋盘各处的白成功令僵局现出生机,并能逐步串连起占据棋盘各处的白子。有职业棋手形容李世石下出“神之一手”,甚至猜测李世石是否已经看穿 AlphaGo 的行棋弱点,故意在布局阶段布下诱敌之阵。

李世石逆转形势后,在右方发动攻势,AlphaGo 开始计算应对办法。然而,AlphaGo 一度看似想在右方“提劫”,却没有成功,反而跑出“死子”。有职业棋手判断,李世石下出 AlphaGo 计算以外的变化,让程序出现混乱,甚至笑言程序可能发生故障。现场评论指,就连 AlphaGo 开发者之一,连日来代其走子的黄士杰看到 AlphaGo 在右方下子招式时也面露困惑。结果李世石成功在右方“收气”,稳住一大片形势。战至这个阶段,AlphaGo 每下一手平均都要思考3分钟以上。职业棋手们判断 AlphaGo 已无法扭转劣势,胜负已分。而李世石在“收官”阶段,仍然小心翼翼,没有出现失误。最终,AlphaGo 投子认输,李世石获得首胜。这也是 AlphaGo 自去年10月以 5:0 战胜欧洲围棋冠军樊麾后,首次在对奕中向人类“投降”。

由于李世石在第四局执白获胜,在他自己的要求下,第五局比赛由他执黑先行。李世石选择了较为稳健的开局,AlphaGo 则继续走出新鲜的招法。不过 AlphaGo 在右下角出现了令人费解的下法,白棋“送死”了数子,这也再次表现出 AlphaGo 似乎不太在乎局部的损失。棋局进入中盘,李世石在左上角一手“尖冲”试图削弱*白棋*范围,但 AlphaGo 在空中反镇,*模样逐渐成型;李世石在上边稳健做活,AlphaGo 又顺势围出*大空。

后半盘 AlphaGo 的实力开始展现,但李世石也并未放弃。尽管再次进入“读秒”,但李世石连续走出强硬下法,试图把局面变得更加复杂,以干扰 AlphaGo 的判断。但发挥稳健的 AlphaGo 把微弱的优势保持到了最后,李世石于180手投子认负。

人机合体?从AlphaGo窥探人工智能的进化轨迹

AlphaGo的训练者樊麾

世界上也许只有一人可以与李世石感同身受那就是樊麾,三届欧洲冠军和AlphaGo事实上的教练。他曾以5:0输给AlphaGo。随后,樊麾加盟DeepMind作为训练者。樊麾不断的输掉棋局。但是,随着樊麾不断输给AlphaGo,有趣的事情发生了。范来以一种全新的方式开始看待围棋。在与其他人的比赛中他赢得更多,棋力上升,排名飙升。 AlphaGo事实上也在训练他。

对阵谷歌的AI重新燃起了李世石对围棋的激情。这些天来,世界上最大的,最富有的科技公司利用AlphaGo建立具有竞争优势的技术。哪些应用可以更好识别照片?能够对语音命令做出反应?不久,这些相同类型的系统可以帮助机器人与真实世界的进行向人一样的互动。

在比赛前,Hassabis告诉世界AlphaGo的AI技术可以推动一种新的科学研究,让人类突破新的领域。当时,这些说法毫无凭证,让人认为是典型的高科技炒作。但现在不是了,机器做了非常人性化的事情甚至比人类还要好。是的,你可以看到AlphaGo的37手证明了作为机器向人类进化的早期征兆。或者你可以认为:没有AlphaGo的37手,就不会有李世石的78手。(持文)