欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

张亚勤:人工智能进入第三季 正是爆发时机

程序员文章站 2022-04-24 10:12:40
第三届世界互联网大会继续在乌镇举行。在上午的移动互联网论坛上,百度公司总裁张亚勤发表主题演讲,他认为人工智能在诞生60年之后,目前进入第三季,正是爆发的时机。百度希望与各个行业共享人工智能平台。张亚勤...

张亚勤:人工智能进入第三季 正是爆发时机

第三届世界互联网大会继续在乌镇举行。在上午的移动互联网论坛上,百度公司总裁张亚勤发表主题演讲,他认为人工智能在诞生60年之后,目前进入第三季,正是爆发的时机。百度希望与各个行业共享人工智能平台。

张亚勤在演讲一开始讲了两句话:“人工智能很了不起,人工智能没那么神秘。”过去一年间发生了两件事:第一,人工智能先驱马文·明斯基(Marvin Minsky)去世;第二,AlphaGo战胜了人类棋手李世石。张亚勤回顾,这60年间人工智能有高潮有低谷,目前进入了第三季,是爆发的时机。人工智能真正爆发是在过去10年,特别是过去5年,人工智能在语音识别、图像识别等方面有很大突破,很多人才从研究界走入企业,企业有大量的数据、有很强的计算能力,这是人工智能真正用到服务和产品的主要原因。

张亚勤谈到,人工智能需要超强计算、海量数据和神经网络。百度有多种模型和算法、万亿级参数和全球最大的神经网络。百度在语音和图像识别方面取得了很多成果,目前已经开始应用在医疗、驾驶等方面。希望把百度的平台与行业共享,一起推动中国人工智能和全球人工智能的发展。(温泉)

以下是演讲全文

大家早上好,谢谢小川,今天这场很火,看到大家对人工智能特别关注,最近我去的所有会议或者是论坛,不管是大型的还是私下的聚会,基本上都在谈人工智能。我想讲两句话,首先,人工智能是很了不起的。第二,人工智能没有那么神秘。

今年是人工智能六十周年,有两个标志性的事件:一个是六十年前人工智能主要的提出者去世了,另外一个就是AlphaGO在围棋比赛当中赢了人类,赢了李世石。如果看一下这六十年,人工智能经过了很多波折,有很繁荣的时候,也有它的冬天,现在可以说进入了第三季。我认为第三季应该是爆发的时机。

如果我们看一下的话,最早的时候一开始大家想的很简单,我们对人的大脑更了解之后提出一些规则,还有一些符号,然后把它们用到人工智能系统里面,后来发现这个不奏效,又产生了专家系统,数据多了一些,规则更详细一些,发现还是不够有效。真正的人工智能工作应该是二十年前,这个时候用统计的方式,用机器学习的方式,还没有深度学习,用各种各样的算法,遗传算法、各种算法,其实已经广泛的用到了这个行业,小川他们做搜索的,搜索其实是用人工智能时间最长的,包括一些做推荐广告,用了很长的时间。

真正爆发的话应该是过去的十年,这是快速发展的十年,就是深度学习的算法,在第一篇深度学习文章以后,就发现深度学习用神经网络是一个很有前景的道路。这几年特别是过去的五年,在云识别、图像识别、语言理解都有重大的突破。还有就是很多人才,人才原来从学术界走入企业。走入企业之后有一个很重要的特点,就是企业里面有大量的数据,然后有很强的计算能力,这也是为什么人工智能现在开始成为真正的成为主流,真正应用到服务、应用到产品上的重要原因。

PPT上写了几个公司,百度、谷歌、Facebook、微软,这是最近《财富杂志》评的四个AI公司。其实现在很多公司AI做的很好,刚才联想的元庆讲的把智能设备用到云里面,小川做搜索也相当好,IBM也是我们学习的一个很好的模式。

我刚才提到了三个方面,一、是更先进的算法,二是超计算能力,三是海量的数据。百度公司这三个方面也都有不少的进展,我们的算法现在有许许多多各种各样的模式,有万亿级的参数,有全球最大的深度神经网络,有千亿级的特征训练、千亿级的样本,规模相当大。

10:59[张亚勤]第二点我们的计算能够很强,我们有几十台服务器,而且有很多CPU,有很多CPU集群,这样的一个计算,其实加速了神经网络的收敛,很多数据需要快速的收敛,现在我们可以搭建一百多层的深度神经网络。我记得十几年前我们做神经网络做到三层不得了了,现在一百多层都比较容易了。

另外就是数据,百度有很多很多数据,有很多网页的数据,有很多搜索的数据、定位的数据、交易数据、行为数据。通过这些数据可以很容易地打造独特的知识图谱,打造用户画像以及商业逻辑。这些东西我们把它叫做百度大脑,百度大脑就是有计算有服务器,有许许多多的数据,然后由先进算法组成。这里面有很多模块和能力。

现在相对比较成熟的是四个方面,一是语音识别,也是深度学习用的第一个成功的例子。语音识别目前的准确率已经可以达到在安静环境下达到97%,在方言、速度语速快了以后,比人类还要准确一些。在比较杂音的环境下,在车载环境下可以达到92%—93%左右,最近把一些新的算法用图像训练的方式用在语音识别里面,发现又可以提高10%—15%左右,语音识别现在已经非常实用。

二是图像识别,语音方面已经达到了很高的准确度。我们在语音方面也有很多产品,比如说用手机百度现在可以用语音搜索,你可以听到语音的合成。我们最近有一个产品“度秘”可以用到音响上,也可以用到车里面,这不仅仅是一个自然对话的软件,其实它是一个连接服务的一个载体,所以用“度秘”你可以订餐、订票、管理日程,也可以聊天,也可以帮你做体育解说,也可以唱歌,也可以作诗,后面连接了很多数据和服务。另外在图像和视频方面,刚才Facebook的石峰讲过,很多方面由于有大量的图像和视频,这个时候需要找到一个模式,人脸识别相当成熟,目前已经到99.7%的准确率,比人眼更准确了。在图像视频的自动描述方面,也越来越精确了,比如说根据视频可以知道这是一个小狗在玩水,这边知道是一个火车沿着森林驰过。

所以说AI真正会带来一些新的变革,可以用到每个方面,可以说医疗、教育、金融、交通,也可以用到无人车上,再举一个简单的例子,比如说医疗方面,医疗方面我们最近有一个百度医生的产品,其实就是用一个像医疗的机器人,可以阅读大量的医疗文献、资料、病人的病例,模拟人和医生自然的交流、问诊的流程,然后可以把这些信息告诉医生,也可以把这个信息告诉病人,这对于现在目前我们中国医患紧张问题有很大帮助,现在有很多好医生,但也有很多病人,医生和病人之间的沟通还是有很多的问题。这个可以帮助基层医生提高诊断率,也可以帮忙专家医生,让他们减少问诊的时间,这个系统已经开始使用了,数据越多会越准确,因为这是一个自我学习、自我提升的一个过程。

举一个例子,目前用百度手机医生马上可以实现,我们叫“智能小e”机器人,医生很多时候需要花很多精力了解病人问诊,用“智能小e”就可以省去很多过程。另外一方面就是出行,今天下午我会多讲一下,在智能驾驶方面取得的进展。刚才我觉得杰瑞·卡普兰讲了一个很有趣的例子,人工智能有些方面比较聪明,有些方面比较笨拙,我们经常开玩笑说机器人可以开车,结果打不开车门,所以在智能驾驶方面,目前确实取得进展比我们想象的要快很多,百度有两个路径,一个路径是L3,是一个比较渐进的,在有限的条件下进行自动驾驶、智能驾驶,根据现在的高精地图、精准定位、计算机视觉然后和厂商进行合作,包括车联网、操作系统这种比较现成的技术。

还有一个L4,完全无人驾驶,这对整个环境、技术要求相对比较严格。L3和L4有很多共同之处,大部分的平台数据,包括机器学习的算法都是可以共享的,但是整个假设的环境是完全不一样的。L3我就不细讲了。L4,大家已经体验了,百度去年差不多这个时候,第一次完成了路测,在北京的五环完成的,这一年取得了很大的进展,我不知道大家有没有机会试一下我们的无人车。在乌镇,现在我们有十八辆车,相对去年取得了很多进展,比如说更复杂的路况、像下雨天有雾霾的天气情况下都可以使用,有更多的传感器,有更强的学习能力。这个方面我们收集了很多数据,把数据放在云端进行学习,最后再传到汽车上,但是大部分决策是在汽车上,这样即使不联线,还是可以自动驾驶。

我也提到了人工智能可以用到各个方面,我们也希望把我们的平台和整个行业共享,所以我们今年九月份开放了两个平台。一个是机器深度学习的平台,叫PaddlePaddle。另外一个是百度大脑,我们把这些能力语音、图像、自然语言、用户画像开放给大家,希望大家一起推动中国人工智能以及全球人工智能行业的发展。蛮有意思的,我记得三十年前比尔·盖茨讲希望有一天机器能像人一样听去看去写,用自然语言交流,今天他提的目标在很大程度上已经达到了,人工智能很有意思,我做计算机研究,最早的时候我们学机器语言,学编程。后来是机器来学人的语言。未来一方面机器要向人学习,人也要向机器学习。

这次AlphaGO击败李世石之后,我说当然AlphaGO有各种大数据,有对抗的算法,有增强的算法,但是向人类学习很多东西,学习人类的棋谱。我们人类你有没有向机器人学习,给你什么启示。其实围棋界很多人看AlphaGO的走法,里面有一些走法确实和专家的常规完全不一样,小川做的解说非常精彩,小川不下棋,他之前预测AlphaGO会赢,我也做计算机研究,我也下棋,之前我认为计算机会赢,但是不是今年。不过今年我觉得还是有特别令激动人心的事,就是人工智能的发展。再次感谢大家!