欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

Siri投资人畅谈虚拟个人助理VPA未来

程序员文章站 2022-04-01 22:41:07
    3月28日消息,据国外媒体报道,(编者按:Norman Winarsky是Ventures的副总裁,Bill Mark是科学研究发展组织SRI国际的信息计算科...

    3月28日消息,据国外媒体报道,(编者按:Norman Winarsky是Ventures的副总裁,Bill Mark是科学研究发展组织SRI国际的信息计算科学部门副总裁。Norman和Bill合作支持了Siri的投资,同时Norman也是投资委员会的成员。这篇文章也是他们二位合作完成。)自从iPhone4S发布以来,Siri已经成为一种潮流。Siri是基于突破性的语音和人工智能技术的革命性消费软件产品。Siri作为一种消费习惯也广泛应用在其他消费媒体,甚至去年11月谷歌CEO施密特曾向美国参议院司法委员会作证表示Siri具有成为谷歌主要威胁的潜力,Siri也一度成为热播美剧《生活大爆炸》的剧情。

   毫无疑问,Siri是苹果和史蒂夫乔布斯的杰作,将虚拟个人助理(VPA)带给亿万消费者,改变了人们看待智能电话的态度。研发团队的天才设计使得Siri超越了简单工具本身,并赋予其人类的个性和交互特征。正像某些与Siri的有趣对话:“Siri你喜欢我么?你知道哪能埋人么?”

   我们都坚信苹果将持续改进Siri,未来的新技术也会不断创造出不同种类的VPA。举例来说苹果很可能面向开发者开放Siri的API,继而孕育出成千上万的与个人助理相关的应用。或许不久之后所有的应用都可以进行有实用价值的语音交互,用户也会渐渐习惯并将之视为顺理成章的功能。

   暂且抛开赞美之词和理性思考,鉴于Siri的核心价值,那么接下来的发展方向是什么?

   我们通常会这样认为:人们已经认识到VPA发展的广阔前景,Siri正好处于这个过程的第一步。下文描绘了我们对Siri未来的畅想。

   首先,Siri的巨大影响力改变了整个产业,在SRI,我们将VPA技术看作是未来产品的核心特性,无论是智能电视、健康护理助手、虚拟教育助理等等,都将具备语音交互能力。VPA不会是一时风靡,而是计算领域长期致力的方向和终极目标。正如我们所言,SRI正在着手三项与VPA相关的研发,这三个项目已经有风险投资跟进,具体的新产品正准备发布,前景不可估量。

   从技术角度来说,Siri真正的影响力是正如广泛宣传的“具有实用性的自然语言输入”,这一用语音代替键盘与计算机交流的方式是一个古老的梦想,历经三十多年才达到现在这种能与用户进行简单流畅沟通的程度。

   开发一套具备“有限词汇和口语识别”能力的软件是第一步,公众熟悉的呼叫中心的自动应答系统就是这样首先登上历史舞台的。但一套能够让计算机对很宽泛的口语输入做出可信回应的软件,开发过程的确相当具有挑战性。Siri不仅需要语音识别技术,还需理解自然语言、文本的含义,并最终理解句意(这一点也是现今大多数人工智能研究的核心)。

   继Siri之后,新的增强语音的人工智能将成为SRI投资重点,尤其是被美国国防部看中的项目,将着重增强处理复杂用户情况的性能表现。

   那么对于那些即将面世的技术,VPA最需要具备的素质是什么?

   下一代VPA将会与用户建立更加深入的关系。今天的Siri有一个使用语音对话的界面,但对话通常只能持续一到两个问答语句。将来的用户与VPA的对话会是复杂的带有多层次和更多细节的过程,主题涉及健康保健、旅游计划、购买衣服或者阐述计划书等复杂背景。

   下一代VPA将有可能长时间保留对话内容,清晰记录人机讨论的细节、提供的答案、具体执行的任务,因为只有越多的进行学习,VPA才能显著改善性能。同样可以看到用户与Siri进行沟通时,提供的细节越多,Siri可以提供的服务也越具个性化。这样的结果是VPA变得更具前瞻性,可以持续关注用户潜在的可能需求,甚至在对话开始前就已经预测到用户的需求。

   为展示新一代VPA的能力,现在让我们假设一段对话,真实使用者名为Lisa,VPA购物助理名为Nina,背景时某一天Lisa想买一个皮包:

   L:Nina,我想买一个新皮包。

   N:好啊!那你是想买上次那个Michael Kors牌子的么?

   L:行,我喜欢Michael Kors牌,但是这次预算的上限是400元。

   N:上次你是从Nordstrom购买的,Nordstrom现在仍然销售Michael Kors牌皮包,并且同时还有其他品牌款式,或许你会喜欢。

   L:嗯,我觉得Michael Kors的一款巧克力色的包不错,标价329元,你发现其他商家有优惠价格么?

   N:我发现确实有其他零售商销售的这款皮包标价只有310元,但退换货政策不如Nordstrom的好。

   L:那好,我们就去Nordstrom买吧。

   Lisa希望Nina具备所有关于购物方面的知识与能力,并且能够利用这些知识协助她进行正确的选择。而VPA也将从这段对话中进行学习,同时会保留这段对话作为历史纪录,为将来的购买活动 做准备。

   正因为VPA的学习行为,它将变得越来越有效率。这种自行学习的能力经常被提及,却很少被实现。“在自然界中学习”(Learning in the wild)这一古老的梦想也刚刚开始成真,因为实现真正具备极强适应性的VPA非常困难。

   当然,随着Nina的能力不断完善,Lisa越来越信任VPA。VPA这种应用不仅高度个性化,还将具备保护个人信息的能力。对于一个VPA,信任较安全和隐私而言更加属于核心需求,下一代VPA将会在这方面显著增强。

   这一切是否听起来十分完美?幸运的是,一个能够与用户真正进行深层次和细节沟通的VPA不再只是科学幻想。SRI正在进行这些方面的研究,我们和研究伙伴正全力以赴努力让这些早日实现。

   至于VPA是否会增进人类的智力水平这个古老的争议,可以追述到发明鼠标的年代,鼠标的发明者Doug Engelbart在1962年撰文阐述如下:

   增进人类智力的意思是提高人类理解复杂问题的能力、为自己独有的需求提供解决方案、并最终解决问题。

   我们相信VPA正是这方面的代表,VPA是目前我们能够看到的协助人类和机器交流的最佳的方式,并将最终改变人类看待机器的态度,正如Doug Engelbart50年前发明鼠标之后对世界产生的深远影响一样。(若姜)