人工智能联合会主席杨强:人工智能如何落地?
2018年媒体经济学家年会人工智能论坛上,国际人工智能联合会理事会主席、国际人工智能协会执委杨强进行了演讲。
杨强表示,他经历了两次人工智能的火热。最早确定博士方向的时候,大家都劝他选人工智能,之后经历人工智能寒冬时他也坚持下来,之后,deep learning的出现使得人工智能领域越来越多的激动人心的事情发生。
人工智能到底怎样才能落地,如何产生巨大的影响?杨强认为,人工智能是一个赋能的引擎,它本身并不自带一个商业场景,所以在考虑人工智能的落地时一定要给它配备一个好的商业场景,在杨强看来,好的商业场景就是它具有非常清楚的边界条件,具有很强的数据的特性,并且这个数据当中有很大的、高频的外界的反溃另外,要有很强的计算资源在后面支持,还要有非常先进的算法,把这些加起来我们会看到一个闭环。
杨强认为,AI的商业闭环应该具有几个特点,首先这个闭环当中最好不要有人的参与,就是自动化的。其次,是这个闭环要非常高频地产生这样的数据、这样的反馈,最后是这样一种迭代使得产生效能的功能是一定要快速地发生,而不能说在几年时间段,一定要在几个星期,甚至几天这样的一个时间段快速地发声。人工智能一定要经过一定的过程,比如我们首先要定义什么是我们面临的人工智能问题,还特别重要的一个是我们投入人工智能以后,能够得到多好的回报,一定要从经济的角度分析人工智能的落地,进行一个比对。同时我们要有一个很短的时间,很快地找到数据,挑选和训练模型,最后能够来测试这个模型。
今后人工智能哪些会是热点?杨强认为,第一是Explainable AI可解释的AI,过去的深度学习都是以黑箱的形式出现,可解释就变得很重要,比如医疗、金融、*的决策都需要透明的可解释的AI。第二是AI for all降低人工智能的门槛,此外还有迁移学习,不需要建设的数据,机器学习的加速,最终使得AI成为一种服务。
杨强着重介绍了他在迁移学习所取得的成果。迁移学习,把已经有的模型迁移到新的领域。可以做到用小数据解决大问题保证个人隐私不外流。目前杨强设计的领域有机器阅读,机器的舆情分析,跨领域多媒体的知识迁移,个性化的对话系统等。
最后,杨强希望,大家能努力在工业角度把技术门槛降低,实现第四范式的口号:AI for Everyone。
以下是杨强演讲原文,略经编辑。
杨强:大家好,非常荣幸作为第一位演讲来和大家见面。就像刚才主持人所说的,人工智能现在是一个非常火热的名词,但是人工智能如何能够落地于千家万户?这是我们每一个人现在特别关心的一个话题。
首先我们看一下人工智能的历程。像我这个年龄的人比在座的都年长,有幸经历了两次人工智能的起伏,我记得第一次接触人工智能是1985年,就是我在决定要念博士方向的时候,那个时候我周边的这些校友们都异口同声地劝我一定要念人工智能,因为这个是非常火的。在之后90年代经历了一次炎冬,这个也是被我们留下来的这些人挺过去了。之后就有一次一次激动人心的事件发生,比方说Deep blue战胜人类,比如说深度学习的出现,以至于后面大家都熟知的AlphaGo、AlphaZero等等。我们看一下在这些光彩耀人的这些事件之后我们可能更关心的是人工智能如何能够真正地落地,能够在我们生活和工作当中起到它应该起到的作用。我们也努力地分析人工智能到底怎么样才能落地,什么条件,什么必备条件使得人工智能能够真正地产生巨大的影响。我们看的一个方向是这样的,就是人工智能是一个赋能的引擎,它本身并不自带一个商业场景,但是我们一定要给它配备一个好的商业场景,什么叫好的商业场景呢?就是它具有非常清楚的边界条件,具有很强的数据的特性,具有大数据,并且这个数据当中有很大的、高频的外界的反溃另外,要有很强的计算资源在后面支持,还要有非常先进的算法,把这些加起来我们会看到一个闭环,首先这个闭环当中最好不要有人的参与,就是自动化的。其次,是这个闭环要非常高频地产生这样的数据、这样的反馈,最后是这样一种迭代使得产生效能的功能是一定要快速地发生,而不能说在几年时间段,一定要在几个星期,甚至几天这样的一个时间段快速地发声。人工智能一定要经过一定的过程,比如我们首先要定义什么是我们面临的人工智能问题,还特别重要的一个是我们投入人工智能以后,能够得到多好的回报,一定要从经济的角度分析人工智能的落地,进行一个比对。同时我们要有一个很短的时间,很快地找到数据,挑选和训练模型,最后能够来测试这个模型。所以这样的一个流程是每一个人工智能的应用所必不可少的。
那么,有了这样的一个思路,我们也可以放眼看一下,我们现在有了这样的成绩,今后在人工智能哪些会是热点?如果大家去过这些比较高端的学术会议,会发现有一个新的名词叫“Explainable AI”(可解释的人工智能),现在是非常地火爆。为什么会出现这样的词呢?因为可能过去一些爆点,像深度学习都是以一种黑箱的形式出现,我们并不知道它如何工作的,所以如果能够解释人工智能的引擎现在就变成一个非常急迫的任务,比如在关键的落地场景、决策、医疗、教育、包括*的经济的决策,都需要这种“白箱”,这种透明,能够和人们解释后面的原因、因果。还有就是人工智能能不能够把门槛降低,像第四范式就在努力地做这样的一个先知平台,使得普通人也可以用人工智能的产品在上面搭建应用。还有一个就是非结构化数据,这个数据往往是以自然语言的形式出现,可能以其他的信号形式出现,这里面因为有大量的人工需要清理数据的需求,所以它的进步相对于其他人工智能领域相对较慢,但是它的应用面却更加地广泛。还有就是如何让人工智能的训练过程能够变得更加敏捷,就是如何能够Speedup machine learning的流程。最后是人工智能能不能给大家提供服务,就像我们打开自来水一样,我们能够自动地得到这种服务,这样使得社会分工更加清晰,使得不懂得AI的人能够得到AI的好处。能够做到这一点,就是AI能不能为所有的人服务,我们一定要研究这方面的技术,有一个技术是我和我的学生一直以来在研究的叫作迁移学习,迁移学习就是说如何能够把已经有的一个非常靠谱的模型和经验能够迁移到一个类似的领域,使得在新的领域不用花那么大的资源就可以获得一个很好的模型,迁移学习为什么有用呢?第一是它可以应对小数据,就是说在一个类似的领域,我们可以只依靠这个领域的小数据和前一个领域的大数据一起来建立一个新的模型,在小数据新的场景。第二个是它可以解决很多隐私方面的问题。假设我们要把数据迁移到一个个人的终端,这个终端如果有能力把一个通用的模型给适配到一个个性化的模型,它也可以很快地建立一个很靠谱的个性化模型,在手机上有新闻推荐等等之类的,都可以使用到这一点,在做的过程当中我们可以保证个人的隐私不外流。这个在企业服务上就非常地重要,如果一个企业建立了一个模型,为另外一个企业服务,另外那个企业不必要,不需要把数据传到前一个企业去,它在本地就可以进行模型的迁移,这种就可以使得AI as a service可以实现。
我们实验室做的工作,比如通过让机器理解人的知识,能够让机器进行舆情分析,在一个领域做好一个舆情分析的模型以后能够把它迁移到相关的领域,同时可以做跨领域的多媒体的,比方说文字到图像的知识迁移。还有对话系统,假如说我们有一个通用型的对话系统,我们可以迁移到个性化的每个人的手机上,可以进行对话,可以推荐,为个人进行服务。
总结:第四范式的口号“AI For Everyone”一样。这一点怎么得到呢?真正得到这一点需要我们大家不仅需要在学习上、在工业上要努力地把AI的门槛降低,如果真正能做到这一点,就像一个新的大数据和模型驱动的经济演进,这个就是我要讲的,谢谢大家。