欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

智能对话爆发,但要做引擎的百度大脑已经提前赢下这场AI竞赛

程序员文章站 2022-05-04 17:37:42
智能对应引擎所形成的行业生态从客服等职能切入,但沟通方式改变对许多产业的影响却是整体的。百度大脑的智能对话引擎,不仅仅在形成百度自己的AI垂直生态,也在用对话服务模式的变革推动全产业升级。...

文|曾响铃

来源|科技向令说

全面战争不断深入的重要表现,是局部的深度战争。

ai大竞赛就是如此。5月15日,百度大脑召开了一场名为“与未来对话”的发布会,百度大脑“智能对话引擎”及其核心产品unit3.0亮相,智能对话在ai竞赛中的位置全面提升。

事实上,自从语音、视觉在各个场景应用中大放异彩后,ai一直在等待新的爆发点,现在,创新内涵、应用前景都十分丰富的智能对话开始接棒,包括百度在内,诸多大佬级ai平台都盯上了智能对话。

以百度此次发布会为标志,这个ai新的爆发点正式起爆,一场ai全面战争下的局部深度战争打响,而百度凭借ai技术的先期积累,已经占据有利位置。

不过,对似乎提前锁定胜局的百度而言,要以行业“引擎”的姿态做智能对话,下一步要面临的挑战也有不少。

智能对话爆发,但要做引擎的百度大脑已经提前赢下这场AI竞赛

“复杂系统”下,智能对话更需要开放式行业平台

智能对话,从概念上看,其着眼点在“对话”,也即其ai能力扩展到了人机交互的更高层面——像人一样进行对话式互动,而不只是下达和响应被限定的命令。

这给了智能对话提出了更独特的行业发展要求。

1、智能对话是一个“复杂系统”

目前,智能对话在车载、音箱、客服、机器人领域都有广泛的应用。普通人在网络购物、享受服务的过程中,通过聊天框流畅对话的,很可能就是ai而非客服小姐。

不仅如此,现在的智能对话已经能实现语音实时沟通,某些营销电话的对接,可能就是由智能客服完成,而可以做到消费者浑然不知。

很明显,这种“自然”对ai来说要求变得更高了。

与语音操作、视觉识别等成熟ai智能产品相比,要实现尽可能自然的对话,智能对话需要在nlp(自然语言处理,“听见”讲了什么词组、句子)、知识图谱(即ai懂的知识,只有“懂”才能去“聊”)、语音语义一体化(听见的音节能转化成现实的理解,没有这个就好像不懂外语的听外语)等方面都有深度积累。

智能语音无法通过简单的数据+模型训练就能形成单个产品,在本质上,它是一组技术和资源的总集成,需要全面的技术布局和深厚的技术积累 ,也因此,我们看到,智能语音在语音操作、视觉识别火了很久之后,才“姗姗来迟”迎来爆发。

2、做好智能对话,三个“池”缺一不可

正因为是“复杂系统”,所以做好智能对话,其能力需求也十分“立体”。

至少,这三个“池子”的条件平台方必须具备:

首先,要有丰富的“资源池”。如同婴儿学习对话,需要父母不断进行输入,更大量更多样化的输入才能让婴儿更快地实现语言能力成长。智能对话需要大量语料输入,并不断学习外界的“知识”。

然后,是强化学习能力的“技术池”。在输入的基础上,还得有消化能力,不管是新开发的ai技术,还是通用ai技术的借用,智能对话的“复杂系统”都要求ai有更复杂的学习方式和学习过程.

最后,是能够练手的“实践池”。只有具备高密度的现实应用,智能对话才能从“温室”走出,适应“社会环境”,没有真刀真枪上阵,耍再多把式也没用。

3、bat级平台被智能对话天然“预订”

很显然,有大量语料、知识库,又具备充分的ai技术积淀,还有自家练手的场景应用,全部具备三大“池”资源的只有bat这样的平台级企业,小公司几乎不具备从零起步构建智能对话产品的能力,或者说,投入太过巨大而没有现实价值。

与简单要求下的语音、视觉不同,智能对话从一开始就锁定了bat级平台。

而这其中,正是凭借其技术领先、能力丰富的优势,百度大脑才能在这个爆发的节点上,发布其智能对话引擎;在此基础上,百度大脑还针对对话系统定制平台unit发布9大核心特性,形成了全新的对话系统定制平台unit3.0。

相对于有所动作但幅度并不算大的a\t两家ai平台,百度智能对话已经取得行业领先。

搜索出身给了百度巨大的先发优势。不论是天气、星座、美食、快递、团购、小说等信息资源,还是人物、地理、历史体育等问答资源,都让百度的智能对话有了业内难以企及的语料和知识来源。

此外,ai战略让百度为智能对话积累了大量通用技术基底,以及快速上手的能力;而百度地图、apollo、dueros、小度机器人等“真实业务”又成为百度智能对话的练兵场,积淀了可以转化到生态伙伴身上的大量预置技能(可以理解为经过了广泛“实习”)。

智能对话爆发,但要做引擎的百度大脑已经提前赢下这场AI竞赛

百度大脑为什么敢用“引擎”定义智能对话平台?

值得一提的是,智能对话玩家们往往发布都在发布“xx平台”、“xx产品”,而百度此次是直接用“引擎”来定义其智能对话平台。

这固然有拔高竞争维度、强化相对优势的动机,但百度大脑敢这个爆发的关键节点用上“引擎”一词,没有起码的实力是不敢这么高调的。

这里认为,百度大脑能提出“引擎”,基于这三个方面的准备:

1、禀赋上,智能对话平台早已成型

某种程度上,百度此次的发布会并不是在发布一个“新产品”或“新平台”,而更像是一次过去智能对话能力、产品、平台、生态的整合与升级。

在今天正式发布智能对话引擎及其unit3.0之前,百度智能对话对自家产品、生态伙伴的赋能,已经累计实现交互460亿+次,而且这次百度大脑推出的unit3.0版本,在搭建技能、构建知识和整合技能与知识上也做了全面升级,就技能搭建而言,包含预置技能和自定义技能。其中预置技能就包括智能问答、设备控制、影音休闲、生活服务等58大项,沉淀了全网最全面最优质的信息类资源。

可以说,百度的智能对话平台已经是全行业技术最强、能力最丰富、规模最大的平台,这样一个本身就具备业务基础的平台,再次升级只能是朝着更高的行业价值定位方向走。

从而,由“产品”或“平台”转向“引擎”也就自然而然了,毕竟,ai竞赛尤其是平台型ai之间的生态竞争,除了技术和商务的深入还会在定位上不断升级维度。

可以预见,若干时间之后,a/t甚至科大讯飞也会跟上“引擎”的定位。

2、技术上,已实现快速冷启动+高精度长尾优化

在技术层面,百度智能对话引擎及其核心产品unit3.0有一个长达100多页的ppt详尽介绍其各类技术优势,其技术储备的丰富与深度可见一斑(具体见相关报道)。

但总体看来,这里认为,该引擎在技术上有两个分阶段的优势:部署后的快速冷启动,运行过程中的高精度长尾优化。

说白了,既然是引擎,“加速度”能力是十分重要的。

按百度方面的说法,其unit3.0能通过平均77个模板就能实现对话技能的快速冷启动,对比行业需要高达800+模板;以地图导航为例,百度大脑智能对话引擎通过10-100个模板、10-100个样本就能快速启动,实现90%的的准确率。

这意味着,开发者和企业几乎拿来就能满足基本的需求,部署十分简单,对环境要求不高。

而在冷启动完成之后,智能对话的能力pk就转移到第二个阶段:精度的上限能到多少。

90%只是开始,100%只能无限接近。百度智能对话引擎目前已经能实现95%的精度(即机器与人对话,95%是成功理解和互动的),注意,这不是普通的指令式语音互动,这个数字已经在智能对话领域已经远远高于多数玩家。

值得一提的是,精度从冷启动到向上优化的过程,本质上是长尾的过程,在频繁、大量的对话可能性之外,不断覆盖那些出现频率不高的内容。 而这一过程仍然需要人力完成数据的归纳、标注等动作(等于教会机器新鲜词汇或词组的现实意义)。

百度大脑智能对话引擎不仅在做ai的事,还帮助这种“人力”的节省。其datakit等产品能够大幅提升样本生产和标注效率,官方称能把效率提升8倍(从16人/天到2人/天),这一定程度上解决了需要啃食数据的ai发展所自带的人力瓶颈问题。

3、应用上,拥有典型场景并继承百度开放特质

除了具体的数字,在实现场景上,百度大脑也在百度引以为傲的开放特质下,完成了多个典型场景的敷设。

目前,百度智能对话引擎已经在智能客服(中国联动、南方电网、东方航空、浦发银行、广州银行等)、消费电子(家教机、伴学机器人等)、车联网(apollo、小度车载os平台等,涵盖上汽通过、福特等车企)等核心应用领域进行深度应用。

这些典型场景一方面是百度大脑智能对话引擎的实力证明,另一方面也在不断外延的场景实践中,进一步提升“引擎”的多面适用性,积攒推动更多场景前进的“马力”。

在bat甚至整个互联网的竞争格局中,百度“最开放”的优势仍将保持下去,更多对智能对话有需求的开发者、企业方将能获得平等、便捷的开放生态。

百度大脑智能对话生态这趟车,还会有更多“乘客”,这种预期下,把平台定位为“引擎”也就顺理成章。

强化“引擎”的生态推动力,百度大脑未来的三大看点

成为“引擎”不意味着结束——现实生活中的引擎往往都在追求更强的推力、更低的油耗,智能对话“引擎”也不例外。

要让“引擎”获得更强的生态推动力(也意味着百度获得更强的竞争力),百度大脑还需要在这三个层面突破升级的关卡:

1、普惠化:让高可用性智能对话实现低门槛获取

ai终将成为全社会的基础设施,智能对话的普惠化将是这个庞大基础设施体系的一部分。

而技术的普惠化,往往又与技术的深度背道而驰。

霍金能够用最后一片能动的肌肉实现打字、演讲,靠的是ibm独家提供的设备的强大技术实力。但这种技术的造价高昂,只能用于少数人身上。

智能对话比其他ai技术更复杂,决定了它的实现难度更大,所需投入的资源也更多,普惠化面临巨大的门槛压力。而高可用性的智能对话,最终目标一定是实现“图灵测试”突破,人人可享用真正智能化的对话机器人,听起来并不“便宜”。

于是,如何降低门槛就成了关键词。

百度智能对话引擎的庞大预置技能,以及快速冷启动、智能化人工标注,都是降低智能对话应用门槛的动作。在百度智能客服人工智能3.0的规划中,“限定轮次”实现“图灵测试”被写入,这说明,在“引擎”阶段就尽量实现技术的简单易行,将是普惠化的可行方式。

2、定制化:多级生态模式满足不同深度的智能对话需求

既然是生态,智能对话绕不过的问题一定有定制化与标准化的协同问题。

平台提供的产品往往以标准化内容为主,如此在商业上更易于实现规模化;而客户的需求往往带有大量的个性化内容,这样才能更好地匹配只属于自己的用户/消费者实际。

又要标准化、又要定制化,是“平台”们面临的共同难题,也是钳制生态规模的重要因素。

从这个角度看,百度大脑智能生态引擎在具体技术内容上,提供的一些工具或模块,就在尝试解决这类问题。

例如,unit3.0内嵌一个称为us kit的开源中控模块,能无缝对接unit平台能力,在此基础上快速生产定制化对话中控,且开源架构能够不断延展、支持添加各种新能力。

用大白话说,开发者能够通过配置各种标准化技能(接入多个对话场景),快速搭建和定制符合自己业务场景的对话中控,这种对“标准化”的整合与统一,反过来又现实了属于开发者的定制化对话服务。

3、共赢化:用对话服务模式的变革推动全产业升级

为了强调“对话技术进入工业级落地的各项基础条件已具备”,百度方面用了这样一些数据:38%的企业已应用基于智能对话的系统;44%的企业计划在2年内使用智能对话;83.3%企业认为智能对话能有效降低运营成本;78.6%的企业认可智能对话能改善客户体验……

事实上,换个角度看这些数据:对话服务方式的改变,使得智能对话引擎某种程度上成为产业升级浪潮的助力,而不再仅仅是平台、企业、开发者之间的ai商业互动。

为产业中某企业服务的智能对话引擎,在事实上加速着企业(并通过企业改变产业本身)与互联网信息时代融合的速度,在这个过程中,由于客户体验的改变、信息沟通反馈的便捷,企业以及产业的闷头干活的发展方式也将被改变。

而这,正是产业升级的内容。

智能对应引擎所形成的行业生态从客服等职能切入,但沟通方式改变对许多产业的影响却是整体的。百度大脑的智能对话引擎,不仅仅在形成百度自己的ai垂直生态,也在用对话服务模式的变革推动全产业升级。

*此内容为【科技向令说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

【完】

曾响铃

1钛媒体、品途、人人都是产品经理等多家创投、科技网站年度十大作者;

2虎啸奖高级评委;

3作家:【移动互联网+ 新常态下的商业机会】等畅销书作者;

4《商界》《商界评论》《销售与市场》等近十家杂志撰稿人;

5钛媒体、界面、虎嗅等近80家专栏作者;

6“脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业。

7现为“今日头条问答签约作者”、多家科技智能公司传播顾问。