AlphaGo之父: 先解决智能 再用智能解决一切
刘佳
当全世界的创业者以为最前沿的技术创新来自硅谷时,一家创造出了AlphaGo的英国公司DeepMind成为了人工智能领域里最耀眼的明星。
得米斯·哈萨比斯(DemisHassabis)就是那个站在AlphaGo背后的“超级英雄”。
今年5月,这个拥有1/4中国血统的AI明星第一次来到中国,在乌镇发布会场间走来走去的他身边总是围绕着一群工作人员,到处是握手、合影、签名……其间,他还做了一场关于“AlphaGo究竟是什么”的演讲。
当他走进第一财经临时布置的采访间时,很随和地就和第一财经CEO周健工搭上了话,聊起了围棋和阿尔法狗,以及外界看起来颇为神秘的DeepMind公司。
40岁的他,有些谢顶,像极了中国普通高校里的老师。但当他说起自己的使命是“让人工智能成为探索宇宙的‘终极工具’”时,没有人会怀疑他的认真。
他被互联网发明者TimBernersLee称为“地球上最聪明的人类之一”,还被英国媒体誉为人工智能时代的“超级英雄”。
他创办的DeepMind在2014年被谷歌以6亿美元收购,并在此后影响了谷歌未来十年的发展方向,促使谷歌的战略从移动先行转向AI先行。
在人工智能领域,最让他兴奋的两件事,一个是深度学习,另一个是强化学习,AlphaGo正是二者的结合,也是迈向通用人工智能目标的重要一步。哈萨比斯说:“现在先解决智能,再用智能去解决一切。”
从神童到AlphaGo
5月27日,人机大战三番棋最后一役,AlphaGo与当今排名世界第一的中国年轻围棋大师柯洁的总比分最终定格在了3∶0。
半个小时后,站在台上的哈萨比斯和柯洁握手、相拥,现场的掌声久久没有停息。
“这大概就是天才与天才之间的惺惺相惜吧!”一位现场的工作人员感慨道。
哈萨比斯称得上是“少年天才”。他喜欢各类智力游戏,从4岁开始下国际象棋,13岁时就获得了国际象棋大师称号,至今仍然保持着5次获得“智力奥运会”精英赛冠军的世界纪录。
11岁去列支敦士登参加一场一场国际巡回赛,令少年哈萨比斯印象深刻。
当时的他和一个丹麦冠军棋手对局,下到10个小时的时候,哈萨比斯剩下王和后,对方剩王、车和象,并占有优势。这场比赛本可以平局结束,但哈萨比斯太累了,选择了认输。
哈萨比斯在BBC一档节目中回忆,这场比赛让他生出了一种顿悟——“我们是不是在浪费大脑,既然这个级别的比赛选手都是顶尖的,为什么不用我们的脑力去做点更有意义的事情,比如解决癌症问题,找到其他疾病的治愈方法,不是更好吗?”
当时,哈萨比斯在同年龄段棋手中排名世界第二,身边几乎所有人都想当然地以为这将是他未来的职业。不过,哈萨比斯并没有从此走上职业棋手的道路,而是对计算机产生浓厚的兴趣。
在学校里,几个朋友和哈萨比斯组成了黑客俱乐部,一起写代码,做影像演示,复制曾看过的电影或玩过的游戏,所有的业余时间都花在了怎么用这些电脑更好地编程。
20岁时,哈萨比斯获得剑桥大学计算机科学学位,之后成立视频游戏公司Elixir。他评价,成功的游戏都会从一个侧面反映生活,从中学到很多东西,“生活不允许我们一直追求安稳,需要不断激发我们产生新的想法,改进策略,开发自己的大脑,而游戏像是大脑体操。”
此后,哈萨比斯又选择回归学术,在伦敦大学学院攻读神经科学博士学位,完成海马体和情景记忆学术研究,并在2011年与人工智能专家同事ShaneLegg、连续创业者MustafaSuleyman一起创立DeepMind团队。
作为“异于常人”的天才,哈萨比斯有着自己独特的“生物钟”:上午10点开始工作,花一整天在DeepMind办公室,回去和家人一起吃晚饭,然后在晚上10点开始第二天的工作,直到早上4点才去睡觉。通常,他会在夜里的几个小时进行研究,读最新的学术论文,以及创造性地思考。
2014年,谷歌以6亿美元的价格收购DeepMind,这是当时谷歌在欧洲进行的最大手笔收购案,而那时的DeepMind还没公开发布过任何产品,只有20个技术人员。
有了谷歌的“加持”,DeepMind加速了对AlphaGo的研发。直到去年3月,AlphaGo以4∶1的成绩战胜了曾经排名世界第一的围棋选手李世石,被视作人工智能发展史上的历史性突破。
在学术领域,DeepMind也证明了它的价值:2015年2月,DeepMind在科学杂志《自然》上发表论文,介绍了能够通过学习成为雅达利(现代游戏机始祖)游戏高手的人工主体。去年1月,DeepMind再次发表论文,称他们的新算法AlphaGo在围棋上取得巨大突破。哈萨比斯在管理DeepMind之余,还同时在世界*科学大会上发表了4篇论文。
而这些丰富的经历,或许与哈萨比斯的家庭教育不无关系。“我的背景很多元化。”哈萨比斯在接受第一财经独家采访时说,他的父亲有着希腊和塞浦路斯血统,年轻时是一位创作歌手,而母亲则出生自新加坡籍华人,他们都喜欢按自己的喜好做事,这对他的影响是——“不要循规蹈矩,走自己的路,并且一直走下去,那才是生活的正确方式。”
给聪明人一个机会
在一次TED大会上,时任谷歌CEO的LarryPage谈起哈萨比斯时滔滔不绝,并且把DeepMind称为“很长一段时间以来,我见到过的最令人兴奋的东西之一”。
而哈萨比斯所带领的DeepMind在人工智能领域取得的成功,显然已经说服了谷歌,是时候把研究人工智能当作公司的首要目标了。
“我们很高兴能证明,最前沿的科技并不仅仅存在于硅谷中。我为自己是一个英国人,并且扛起英国的创新旗帜而感到自豪。”哈萨比斯对第一财经说。
在他眼里,英国一直以来都有研究电脑科技和人工智能的创新传统,例如阿兰·图灵和“互联网之父”蒂姆·伯纳斯·李。只不过,也许大家不那么擅长把科技转化为商业上的成功。
“很多地方都能做前沿研究,就像伦敦和中国,为什么不呢?只要你有足够多的聪明人,并且给他们一个机会。”哈萨比斯说。
站在哈萨比斯和DeepMind身后的,就是一群来自超过60个国家最聪明的人才,不断地解决人工智能领域最有趣的挑战。
他告诉第一财经记者,目前DeepMind伦敦有400到500名员工。其中有超过200名顶尖博士和科学家。
如何吸引这些顶尖人才从世界各地来到DeepMind,哈萨比斯笑着说:“最顶尖的人总是想和世界上其他顶尖的人一起工作。”特别是当你开始做出AlphaGo这样的产品,或是在《自然》杂志上发表研究成果,就是向世界上最好的人才打出了广告,“如果他们想做出像AlphaGo这样伟大的产品,那么DeepMind就是一个工作的好地方。”
另一方面,这些顶尖人才往往想要研究最有趣的问题,接受最有趣、最智慧的挑战。哈萨比斯认为,解决人工智能问题就是你能干的最有趣的事儿之一,所以对那些聪明绝顶的人来说,研究中遇到的挑战也是非常有趣的。
第三个原因,则归功于DeepMind创造出的独特的研究文化,这是一种学术院实验室和初创公司模式的混合体,DeepMind尝试着吸取两边的精华,并把它们结合起来。
哈萨比斯说,这种混合文化涉及DeepMind所做的每一件事,包括面试流程、管理流程、项目管理……所有这些都是为了促进研究尽可能快地取得成果而特别设计的。例如,在学术院实验室做研究,往往不太可能拥有在初创公司工作的能量和快节奏;而初创公司常常遇到的问题是目标不够远大,也没有足够的雄心来完成想做的研究,DeepMind要做的就是把这两方面融合在一起。
而这种人才国际化的好处是:不同文化背景的人才、不同的思维方式也随之而来。“我认为这对科研项目有很大的帮助,因为采纳尽可能多维度的观点有助于你找到客观的前进方向。”
可以说,DeepMind充斥着博士和拿着顶尖学府的顶尖文凭的人才。不过,如果大学辍学的史蒂夫·乔布斯生活在人工智能时代,他会成功吗?
面对这个问题,哈萨比斯的回答是:很有可能。
“你说得对,我们这里大多数人都有着顶尖文凭,但是他们中也有一些人并没有,他们是自学成才的,尤其是在工程领域,他们也做出了杰出的贡献。”哈萨比斯认为因人而异,“一个像史蒂夫·乔布斯这样非凡的人无论尝试做什么都能成功。”
围棋界的“哈勃天文望远镜”
围棋起源于中国,已经流传了近3000年。2016年春天,AlphaGo与世界围棋选手李世石的一场世纪人机大战,标志着人工智能取得了历史性的突破,更引发了一波人工智能创业热。
一年之后,高智能的机器来到中国,打败了中国的顶尖选手。
人机大战最后一役,柯洁局中落泪,赛后哽咽,说AlphaGo太完美,完美到没有希望。
在讲解棋局时,“棋圣”聂卫平对于AlphaGo的称呼从阿尔法狗到阿尔法围棋,最后再到“阿老师”。
在围棋业余一段左右水平的哈萨比斯看来,“这就像人们利用哈勃望远镜发现新的宇宙空间一样。AlphaGo就是围棋界的‘哈勃天文望远镜’。”
围棋看似规则简单,复杂性却是难以想象的。它一共有10的170次方种可能性,这个数字比整个宇宙中的原子数10的80次方都多,没有办法穷举出围棋所有可能的结果。
更困难的是,围棋不像象棋等游戏靠计算,而是要靠直觉。“围棋中没有等级概念,所有棋子都一样,围棋是筑防游戏,因此需要盘算未来。你在下棋的过程中,是棋盘在心中,必须要预测未来。小小一个棋子可撼动全局,牵一发动全身。围棋‘妙手’如受天启。”哈萨比斯解释道。
人机大战已经落幕,但人类围绕人工智能的探索才刚刚起步。
AlphaGo已经展示出了创造力,在某一个领域它甚至已经可以模仿人类直觉了。在不远的将来,它是否会拥有独立学习机制并产生独立的动机?甚至进化出情绪识别能力,通过判断柯洁的表情来故意输给柯洁?
哈萨比斯大笑着说:“也许我们确实应该装上一套判断系统。”但事实上,在训练AlphaGo的过程中,接触到职业棋手的机会非常少,大多数情况下都是自我学习。
他告诉第一财经记者,目前AlphaGo不能自己设定自己的目标,而是需要开发人员在设计系统的时候给它定个目标。这就像AlphaGo的目标不是开车或是其他,只知道开发人员给它定的目标,那就是赢得围棋比赛。
他说,在可预见的将来,人工智能系统会被设计成实现设计者既定目标的工具。怎么去实现目标,也可以让机器来学习。“一般说来,我认为这些系统都会竭尽所能去实现我们设定的目标。”
AlphaGo的“星辰大海”
去年3月谷歌AlphaGo战胜人类棋手时,搜狗CEO王小川给公司放了一天假,庆祝人工智能的历史性突破。
3个月后,王小川曾去英国伦敦拜访DeepMind,问当时机器输掉第四局棋时究竟发生了什么?“不是程序有BUG,就是深度学习本身有瓶颈。”但对方用了3个月去复盘仍没有给出解决的答案。这给王小川留下一个深刻的印象,深度学习还是存在瓶颈的。
AlphaGo距离强人工智能,甚至超人工智能还有多远?
哈萨比斯对第一财经说,这像在科幻片里的一些超级人工智能,我们离那个目标还很遥远,至少还有几十年的路要走,“因为有关于人工智能方面的一些关键的问题,我们还没有攻克下来。”
他对记者坦言,围绕AlphaGo,背后的技术包括图像处理、大数据分析等,目前在其他领域的使用还在早期探索阶段,只在AlphaGo研究的中间环节某些领域应用,但是在未来肯定会在多个领域推广相关的技术。
在AlphaGo刚刚获封中国围棋九段后,哈萨比斯宣布它将退出竞技比赛的舞台,AlphaGo的研发团队将把精力投入到其他重大挑战中,研发出高级通用算法,为科学家们解决最复杂的问题提供帮助,包括找到新的疾病治疗方法、显著降低能源消耗、发明革命性的新材料等。
“如果人工智能能够在上述领域发现新的知识和策略,那在这些领域的突破将十分可观。我们已经迫不及待地想看到这一切的发生。”包括哈萨比斯在内的DeepMind高管在博客中说。
去年夏天,谷歌已经把DeepMind人工智能接入谷歌数据中心,来帮助这家巨无霸公司节省能源开支。据说,节省下来的开支作为它2014年收购DeepMind的部分支付款项。
此外,哈萨比斯举例,通过与人类专家的合作,可以找到各种各样的创新方式,包括把AlphaGo的其中一种变体应用于医疗行业,正在着力解决蛋白质折叠的问题,用来治疗阿尔兹海默症。”
“人机合作可以达到1+1大于2的效果,人类的智慧将被人工智能放大。人工智能和AlphaGo都是工具,就像哈勃望远镜一样,可以推进人类文明的进步。”
而人工智能和所有强大的新技术一样,都是在伦理和责任的约束中造福人类。哈萨比斯认为,“人工智能应该是应用于科学、制药等领域,而不是应用于研发武器、战争上。”
不过,当人工智能的大潮涌来,不难看到数据、人才、资本以及电脑计算力有着向越来越少数的公司集中的趋势。人工智能行业是否会被垄断?而那些人工智能领域的创业者成长的空间在哪里?
哈萨比斯说,这正是DeepMind公开研究成果的原因。这一领域的发展方向,一定是在一个更广阔的范围内为全人类共享利益,“而不是仅仅局限于少数几家巨头公司。”