欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

专访戴文渊:AI应该像Windows一样 让大众也能用

程序员文章站 2022-07-08 12:48:21
第四届世界互联网大会昨日在乌镇开幕。会议期间,国内AI初创企业第四范式发布了企业AI核心系统"先知"3.0版本,大幅降低了人工智能应用的开发门槛。不同于先前版本的全流程学习平台,先...

专访戴文渊:AI应该像Windows一样 让大众也能用

第四届世界互联网大会昨日在乌镇开幕。会议期间,国内AI初创企业第四范式发布了企业AI核心系统"先知"3.0版本,大幅降低了人工智能应用的开发门槛。不同于先前版本的全流程学习平台,先知3.0包括数据、算法、生产三个核心,能够帮助AI技术进入企业决策层的核心系统,也就是帮助企业建立自己的AI应用技术。发布会后,第四范式CEO戴文渊接受了媒体智能的专访,谈及他如何打造了AI时代的Windows系统。

以下戴文渊专访实录:

记者:先知3.0系统相比之前的版本最大的改变是什么?

戴文渊:先知产品是去年7月20号第一次对外发布,但其实当时的版本已经是2.0版,因为之前1.0版已经在某全国性股份制银行适用。

今年3.0版先知最大的一个定位改变,是把先知定位成“企业AI核心系统”,为什么要这样子改变?是因为我们越来越发现企业需要不仅仅是一个算法或者一个系统。一直以来,第四范式在做的事情都是要降低企业使用人工智能的门槛。在早期,我们把先知的目标设计为降低算法门槛和系统的门槛,所以一直到先知2.0,先知的定位都是低门槛的机器学习开发平台、低门槛的人工智能应用开发平台。

但是我们发现这样仍然不够,一个企业如果想要很好地应用AI能力,除了要降低机器学习的门槛外,外围还有很多的工作要做,所以先知又扩展了自己的外延,我们打通了从数据到业务的闭环,将机器学习产生智能的能力,与业务环节连接,形成了一个“机器学习圈”。围绕着“机器学习圈”,我们重构了整个先知的使用方式,让企业能够更清晰、更便捷地产生智能应用场景,这就是先知3.0想要达到一个效果。

记者:我们是如何选择客户的?目前为什么选择金融和医疗这两个领域?

戴文渊:我们的目标一直都是要帮助全行业惠享人工智能的福利,我们的愿景是AI for everyone,我们并没有说主攻哪个行业,当然现在来看有些重点的方向,比如说像金融、互联网、医疗,这些是我们更重点来关注的企业,但是我们并没有说只是做某一个行业。

其实从行业来说,金融是个很特殊的行业,金融并不是一个具体的行业,金融和科技一样,都是能够去服务其它每一个行业的,一个企业既需要金融的支持,也需要科技的支持,我们先服务好金融,也是我们服务好其他行业的一个基础,当我们服务好金融以后,我们其实可以切入到其他的行业,再切入到其他行业的时候,我们会使用科技和金融结合的方式去服务这些企业。

记者:先知3.0是要打造像TensorFlow这样的系统吗?这个理解准确不准确?我们跟他们差异是什么?

戴文渊:实际上我们比TensorFlow要宽得多。今天我们把先知定位成企业的AI核心系统,这个核心系统其实会有三个核心——数据核心,算法核心,还有生产核心。我们算法核心里面会分这么几个层面,一个是低门槛的算法,其核心算法是由我们自研,第二部分是我们也会充分地去集成各种各样开源系统,TensorFlow相当于是其中一部分。所以我们的产品并不仅仅是一个TensorFlow,而是帮助企业构建一个完整的智能能力的闭环,这个智能能力的闭环当中,可能会有一个环节,如果企业想用TensorFlow,就可以把它接入。企业可能在这个环节需要使用的不是TensorFlow,所以我们还配会有更低门槛的算法,会更适用一些业务人员去开发机器学习。

记者:我们给企业提供AI的时候,我们为什么想把这个门槛降低呢?因为在我看来好像人说专业的人做专业的事情,我们其实降低了门槛,也不可能真的让行政每天过来做开发?

戴文渊:其实真的未见得,我跟你说一个夸张的事,我们公司的行政都能开发AI,当然前提是在我们这个平台上。假设您有个APP,我能把它变成千人千面,这个门槛已经低到今天不需要一个科学家来做,在先知上面,哪怕是我们公司的HR、行政的同事都能够做。

记者:你们最终目标是什么?

戴文渊:为什么干这件事?因为未来AI应用应该是遍地开花,但科学家是少的,科学家一定是小众人群,从来没有说世界上有一大批人都是科学家,所以如果要依赖科学家去做应用,AI一定不能发展起来。所以未来我们希望这些应用背后都是由AI驱动,就必须要让大众能够去掌握人工智能的能力,这个时候就不叫专业的人做专业的事了,或者说未来在这个专业应该有更多的人。就好像现在的民航的飞机,经过培训的飞行员都可以飞,而最早莱特兄弟的飞机只有他们自己能往上飞,这就是很大的差别,所有科技都是需要慢慢朝大众化方向发展。就像汽车,现在考个驾照不那么难,仍然有人没有能力去考驾照,但是如果无人车出现了,那就没有驾照也可以了。

记者:不同的行业,它的数据采集标准应该是不一样的?

戴文渊:对,不同的行业标准不一样,我们定义了产生AI能力的数据的采集标准,并且我们提供了工具,然后能够帮助企业正确采集到AI所需要的数据。比方说金融领域反欺诈场景,过程数据我们要采集交易授权,反馈数据我们要采集投诉。

记者:之前我跟您聊的时候,先知还在2.0时代,您说您先知系统要打造AI时代的一个windows,现在做到了3.0版本,距离这个理想到还有多远?

戴文渊:其实更近了一步,在先知2.0就好像没有资源管理器的windows,虽然我们提供了核心的计算能力,核心的数据储存能力,但是在之后和客户磨合的过程当中,我们发现需要更多地关注资源有没有管理到位,数据有没有提供正确?所以为什么我们今天要把整个闭环管理起来,这样我们会更容易能够去提供出一个准确的AI应用。

记者:你们的商业模式是怎样的?

戴文渊:百度可以把语音识别免费,但是百度不能把百度云免费,一个是边际成本为零的事情,一个是边际成本不为零的事情,未来所有的边际成本为零的事情都是免费,但是边际成本不为零的事情不会免费。

记者:很多互联网巨头都在打造自己的AI平台和系统,先知系统在我看来就很特别,但与其他的AI平台有什么不同?

戴文渊:我们的目标是降低企业使用人工智能的门槛,但是我们一直在调整产品,目的是提供更多的服务。我们不是一定要去跟别人去对比说,你也是平台,我也是平台。讲平台是一件很容易的事,我做什么东西都可以说自己是平台,关键不在于是不是平台,关键在于你在解决什么样的问题。因为我长期在帮助企业去构建AI的能力,我会发现其实很多企业,它其实构建AI能力非常困难,这个困难体现在很多地方,包括算法的层面,包括系统的层面,包括认知的层面,今天我们已经解决了很多问题,但是其实我们仍然需要解决更多的问题。

记者:如果比如说有一个企业它想用你们的系统建立AI自己的核心系统,它提供的数据,如果想用语音的模块,还有视觉的模块,这个东西是你们来提供还是他们可以接其他的平台?

戴文渊:语音和视觉是先知3.0可以产生的模型,我们的系统构建一个语音识别的闭环,就可以产出语音识别的能力。在这个语音识别的闭环中,“行动”就是语音识别的一个过程,“反馈”就是说识别结果对还是不对,然后基于这两部分数据,机器学习就可以产生一个语音识别的模型。其实我们已经在帮助企业构建像手写识别的能力,人脸识别的能力。我们不一样的地方,是我们让我们的客户自己拥有产出了机器学习的能力,而现在市面上绝大多数AI公司,你不需要有机器学习的能力,你买我的服务就行,这是完全不一样的产品定位。

记者:假如说我有一个公司,我就觉得现在公司考勤这个环节,就特别地麻烦,因为现在考勤有各种各样的刷指纹,如果我用你这个可以怎么解决?

戴文渊:如果识别人脸就这样,您把您公司内所有人的照片给到我,并且每个照片对应的是什么样的人,输入到我们系统里,就生成了一个您公司的人脸识别模型。不过这个模型非常针对于您公司特定的问题,不是一个通用的人脸识别的问题,不能识别别人公司的人脸。而是只能解决你们公司的问题。

记者:企业利用先知系统自己做,跟我们去买一套方案相比的话,哪一个成本更低?

戴文渊:其实有两种解决方案,一种是咱们买别人的,就是找一拨人来替我做。另外一种我自己做,我自己做的话,其实门槛最大的问题,我能不能招到足够的人才去做这样的事情?如果说我采购一个平台,以后我就自己能做了,那其实是一个非常好的一件事,因为实际上应用会非常非常多,过去可能没有人做。比如在我们与某全国性股份制银行的合作中,银行内部员工就利用这套AI核心系统在其它20多个日常的运营业务场景中提升效率、发挥价值,有很多场景是这在没有这个系统之前是不会想到去优化的。

其实,先知系统的方案成本一定是更低的。不过我认为目前AI最大的问题还不在于成本,或者是怎么降低成本,最大的问题是没有足够多的人去做,AI应用方面其实能想到的方向与场景特别特别多,做都做不过来,但是因为只有一部分人会做,而那些人现在特别抢手,所以有大量的需求被压抑着,跟成本相比,我觉得能做是现在更需要解决的问题。

记者:这样一个企业级的核心系统,最难的地方在什么地方?

戴文渊:首先第一点是你的出发点,做企业级核心系统的出发点是,你必须时时刻刻心里想怎么去帮助这些企业解决问题,这是前提。其实我们在做这个过程当中,我们关注的不是说我们要推一个什么形态的平台,第一点最重要的是要解决企业什么样的问题,之后每天都要思考离解决这个问题还差什么。要解决的问题还差的部分,我们怎么来帮助。

基于这个出发点,我们发现,企业用AI首先要解决算法的问题。在过去的三年,我们投入非常多的精力研发低门槛的机器学习算法。实际上整个学界并不研究这个东西,学界研究的都是说效果更好的机器学习算法,哪怕说这个效果更好的机器学习算法,全世界只有一个人用,只有效果更好就可以了。而第四范式研究的是什么呢?假设我的算法跟你的算法哪怕一样好,但如果我这个算法能有多10倍的人会用,我认为这个事情是值得去做的事情,这就是围绕着我们的目标、我们要做什么。其次,在算法之外,怎么去定义人工智能的数据标准,以及构建这个数据采集的能力也是很重要的。

让团队瞄准企业确实很困难的点,围绕这些困难不管有多少的问题没有去解决,我们都要去把这个问题解决,我觉得这个出发点是很重要的。

其实在解决问题的过程当中,我们当然也组建了世界领先的团队,就像在解决哥德巴赫猜想的过程中会冒出很多世界领先数学家一样,我们现在也很自豪地说,我们在很多领域,包括在算法层面,特别是低门槛的机器学习算法层面我们是走在世界领先的;在系统架构层面,比方说多维的系统架构,这个多维是多达上亿维的系统架构,在这个基础上还要做到实时处理。实时现在其实已经门槛并不是那么高了,但是现在市面上所有的实时,都是低维实时,比如说一万维我做到毫秒级,这并不是很大的问题,但是如果万亿维仍然能做到毫秒级,业界其实也就我们现在能做到。

记者:您如何去维护先知的系统生态,当你们面向一些企业级的用户做开发者平台、开发者社区,怎么去做?

戴文渊:一个开发平台,上面一定是要有生态的,我们在去年推出了一个计划,叫做“范式大学”,范式大学的定位是,我们会用四天的时间(今年年初的时候是一个月,到今年下半年,我们把它优化到了用四天),在先知平台上培养出一个数据科学家,一个合格的数据科学家。当然这还不够,科学家并不是一个零到一的问题,咱们可以从四天时间从零到一,但是未来他还需要从一到十,从十到一百,所以四天以后我们还会有一个计划,是“范式大学”计划的长期版。您通过四天的培训以后,从零到一,您会结识一个导师,这个导师能够长期帮助您不断去提升,这就是在从一到十,从十到一百的过程,永远都会有一个人帮助你提升,遇到什么困难的时候会有人在旁边去提醒你或者点拨你,帮助您最后成为一个一百分的数据科学家。

记者:您怎么去定义“范式大学”这种模式呢?

戴文渊:这个模式其实就是,一开始我们有个种子,我们从两三个人发展到一个三四十人的团队,现在我们开始有信心能把三四十人的团队往外开展,让三四十人成为更多的范式大学学员的导师,把他们培养起来。未来这些学员当他从一到十、到一百的过程中,很多学员也能成为导师,我们又可以吸纳更多的学员,这样就慢慢地,整个的AI科学家的团体就会变大。

记者:请您总结一下今年第四范式成果?明年对于先知系统的期待是什么?

戴文渊:今年其实是一个先知平台大面积落地的一年,你们如果关注我们公司报道的话,我们最近也有些标杆客户不断在落地,基本上来说也都是国内最顶尖的、标杆性的客户,这是今年做到最重要的一件事情。

明年其实我们需要从标杆客户往整个世界去覆盖,所以我们为什么也在紧锣密鼓地去培养我们的生态,因为要覆盖整个市场需要的更多的人才。(完)