余凯:人工智能将带来第四次产业革命
4月28日消息,一年一度的GMIC大会于今日开幕,在下午的全球智能机器人大会上,地平线机器人技术创始人兼CEO余凯发表了开场演讲,认为人工智能将成就第四次产业革命。余凯称人工智能将成为世界上的新物种,人类花3到6个月可以学到的技能,在未来5到10年都会被人工智能取代。
余凯称,过去人类所有的进展实际上都是以人为中心,包括用技术去延展你的体力、脑里,使人走得更快,看得更远。但是今天AlphaGo是跟你下棋,它是自主做决策,是一个自助行为的实体。所以说, 像AlphaGo这样的人工智能是一个新的物种,它的一个核心特征就是这种自主决策的行为。
另外,人工智能也会逐步替代人的一些简单的工作。在取代人类工作方面,余凯认为如果是一个人大概花3个月到6个月的时间能够学习到的技能,在未来5到10年的时间都会被机器所替代,比如说驾驶。
余凯认为,大脑系统是未来机器的关键,它需要有感知的能力,需要有认知的能力,需要有决策的能力,这些核心离不开的是算法。在一个深度学习的算法框架下面,我们看到很多人工智能的能力,机器所具备的能力,在过去的十年来都发生着翻天覆地的变化,从语音到图像,甚至到决策的控制,包括语意的理解。余凯称,宇宙中最聪明的智能设备是人类的大脑,如果从机器的角度想去实现这样一个能力,你会看大脑是什么样子,从基本的神经原到感知肌,到更加复杂的网络结构,到我们今天深度的神经网络。目前,人类已经在深度学习上取得了很大的进展。(小羿)
以下为演讲实录:
余凯:大家下午好!我们很多人说这次可能是一个新的产业革命,第四次产业革命,从蒸汽机时代到电器时代到信息时代,我们这次是人工智能时代。为什么说这是一次新的产业革命呢?我们觉得回顾过去十几年的历史,从PC互联网到移动互联网,到我们现在比如说我们叫AR、VR的时代,我们看到很多的信息、内容、服务,包括物理世界所存在的这些实体,比如说嘀嘀打车把每个出租车什么司机,是哪个车号,现在在哪个地方,往哪个地方走都线上化了。所谓物理世界和虚拟世界的界限也比较的虚化了。
比如说我们思考阿尔法狗(AlphaGo)这件事情,它跟我们以前技术的进展很大的不一样是说,过去所有的进展实际上都是以人为中心,去延展你的体力、脑里,使你走得更快,看得更远。但是今天阿尔法狗是跟你下棋,它是自主做决策,这样一个自助行为的实体。这样的话是一个新的物种,它的一个核心特征就是这种自助决策的行为。它会在生活、生产很多的方面,它在逐步替代人的一些简单的工作。比如说我们会看到,如果是一个人大概花3个月到6个月的时间能够学习到的技能,这样的技能在未来5到10年的时间都会被机器所替代,比如说驾驶,过去可能少数人具有一个专车司机,未来每个人都会等效的有一个专车司机,因为每一个车在15年到20年的时间里面应都是自动驾驶的。
我们把Robot翻译成机器人,你在这个机器后面承载的一个人的概念,这个概念它实际上跟Robot的本意有可能不一样。比如说我们查剑桥的辞典,我们查Robot这个词讲的是什么意思?讲的是它可以自动完成一定任务计算机控制下面的机器。所以Robot讲的是智能机器,它跟人这个词并没有一个必然的关联。
我们想有没有机器人这样一个词?其实是有的,我相信在座的各位用的是手机的操作系统是安卓的,我们查安卓这个词,意思是长得像人的Robot。安卓是一个人形机器人,它实际上在一个很宽泛概念里面非常小的一个例子,但是在更宽广的语境下面讲的是智能机器,智能机器当然有各种各样的多样化的。在中国的语境下面有的时候你会问这样一个问题,这个是Robot?这个它当然是一个机器人,它可以自助的跟你交互。长城会的兄弟们放了一个机器人在我们公司调戏了它一个礼拜,如果你在它周围走动的时候,它眼睛会一直看着你,跟着产生很有意思的互动。它显然是机器人,它也是Robot。
我问大家这个问题,这个是不是一个Robot?这个是不是一个安卓的?我记得日本的石黑浩教授每年都会来我们这个会场,至少一次,带着他的美女机器人,我们很多的记者也会去报道,说日本的机器人技术怎么样怎么样了。我在这里面想澄清一点,就是我们有一些媒体记者需要他们的知识,如果你稍微了解一下,实际上在台的后面的某一个小房间里面,有一个小女生坐在电脑面前,它实际上所有的交互都是这个小女生来控制的。它的语音识别,甚至它的反馈,都是后面的小女生来完成的。所以这样的一个形态的东西,它完完全全是一个木偶。
这些机器人它没有人的形状,但是它们能和你交互,可能成为你生活中的陪伴,或者是家庭里面的一个中控。这样一个智能交互的设备它当然是Robot,但是它不是安卓的。
我们看这些玩具,这些所有的品类在生活中无处不在它们今天只是我们叫功能型,但是未来它应该是变成它们装上传感器,配上算法,有控制系统,它可以自助的行为决策。未来所有这些品类,它们都会变成Robot,都会变成无处不在的自助的机器。所以这是一个大的趋势。在移动互联网以后,比移动互联网更大的未来,是无处不在的万物互联,无处不在的万物智能。所以AI Inside它将无处不在。
这样两个图像放在一起,你们有什么感想?在几个星期前有一个新闻,当然全世界都在关注,就是关于阿尔法狗,在那个礼拜关于同一家公司谷歌有另外一个新闻,在座的各位可能也关注到了,谷歌在考虑把他们的一个公司给卖掉,谷歌为什么会做出这样的选择?我们比较这两个图像,另外一边是人类的近亲,它的谷歌,它的肌肉,它更强大,更灵活,但是它还在丛林里面找香蕉吃。人类已经征服太空。人类有非凡的大脑,使人类变得卓越,变得不同。
大脑的系统无疑是未来Robot的关键,它需要有感知的能力,需要有认知的能力,需要有决策的能力。这些核心实际上离不开的是算法。在一个深度学习的算法框架下面,我们看到很多人工智能的能力,机器所具备的能力,在过去的十年来都发生着翻天覆地的变化,从语音到图像,甚至到决策的控制,包括语意的理解。宇宙中最聪明的智能设备是人类的大脑,如果从机器的角度想去实现这样一个能力,你会看大脑是什么样子,从基本的神经原到感知肌,到更加复杂的网络结构,到我们今天深度的神经网络。
深度学习的算法和传统的AI的算法一个很大的不同,AI的算法到了数据大到一定程度的时候,不一定效果不断的变好,但是深度神经网络的算法,你可以看到它不断的提升。比如手阿尔法狗它产生数千万盘棋局的数据,通过它不断的学习深度神经网络,从职业的二段也不知道到职业的多少段,据说是职业13段这样的水平,它的水平在不断的提高,这就是大数据和深度结合所带来的变化。
我们看到因为深度学习的发展,过去在图像领域,在语音领域所引领的,不断去突破它的极限,使它的识别错误率不断的降低。这是语音识别深度神经网络代替深学模型。后来端到端的学习带来语音识别率继续的提升。这是我们看到最近在端到端的深度神经网络在语意的处理和理解上面所取得的进展。
我们最近看到,前面我们看到很多感知方面的进展,从阿尔法狗我们看到,从感知到行为决策,深度学习,进入后一个十年发展的趋势,如果你只是感知,不做任何决策,其实你并不改变这个世界,只有在环境中不断的做决策,去调整,去优化你长期的收益,这个机器才能变成自主行为,并且改变世界的技术。
同样的技术不光是在棋的对局,自动驾驶可以看作是汽车和环境的博弈。这样一个博弈你在每时每刻在连续的做决策,比如说你是加速,你是左还是右,因为你每一次决策,你周围的环境会发生改变,这些你需要连续做决策,最后优化的是一个长期的收益,就是从A地到B地足够的高效,足够的安全。
未来机器人大脑的构架,一种想法完全在云端处理,但是这样会带来问题,比如一个汽车在行使过程中突然有小孩横穿马路,你把数据传导云端,云端处理来回来,如果这个网络不稳定怎么办?说到这种实现和处理,我们自然会想到用什么树立起。我们手机和电脑上都有CPU,我们刚才讲的无处不在的人工智能所需要的这些感知、认知和控制,它需要这些东西是些专用的处理器。你会问,你这个问题有点奇怪,人类的大脑看起来是一个通用的处理器,在座的各位我不知道多少会认为大脑是通用还是专用处理器?认为大脑是通用处理器的举个手?是专用处理器的举个手?就更少了。