欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

Siri联合创始人:苹果的“语音助手”将改变世界

程序员文章站 2023-02-03 07:57:56
2007年,苹果重新发明了电话。明天(美国时间2011年10月4日),苹果可能重新定义用户与电子设备交流的方式。 明天的发布会主题是“Let’s Talk...

2007年,苹果重新发明了电话。明天(美国时间2011年10月4日),苹果可能重新定义用户与电子设备交流的方式。

明天的发布会主题是“Let’s Talk, iPhone”,Talk,这意味着“助手”或许将成为明天苹果发布会上的最大亮点。这一功能由Siri的“个人助手软件”演化而来,对于这一功能,用乔布斯的话来说,叫“人工智能”,而不是“语音搜索”或者“语音识别”神马的。

Siri的自我描述,叫做“虚拟个人助理”(VPA):

虚拟个人助理(VPAs)代表了下一代互联网的互动模式。我们可以与之互动,告诉助手我们想做的事情。它像一个真正的助理,会从各种信息来源、分析个人偏好和互动历史记录,帮助我们处理多种服务,帮助我们完成任务。

实际上早在1987年,苹果就有开始类似的工作。如果你曾经读过李开复老师的自传《世界因你不同》,你可能会对在《今日美国》节目中,Casper“调戏”女主持的情节记忆犹新。好吧,我要告诉开复老师的粉丝们的是,那是一个Bug,听到“When”就发问“什么时候约会”,这当然不是所谓“人工智能”的水准。

让我们来听听Siri的联合创始人Norman Winarsky的观点吧:

首先是背景资料:

电子设备的输入方式最早是通过键盘进行的,然后是鼠标,再接下来是现在流行的触摸界面。这些方式都不是苹果发明的,但是确实在乔布斯手中发扬光大,从非主流变成主流的。

语音会在苹果手中变成第四代的输入方式吗?

计算机不会犯错,如果哪里出了问题,那一定是你下达的命令错了——不过,计算机语言对于大多数人来说实在太难懂了。我们要做的是通过人工智能,让计算机理解我们的语言,去寻找答案,并将该信息传送回给我们。

2003年,美国*开始了史上最雄心勃勃的人工智能项目:CALO(认知学习助手和组织)。该项目汇集了来自从25所*大学和商业研究机构的300多名研究人员。在2007年该项目结束之时,项目协作方之一的斯坦福国际研究院(SRI International)成立了Siri,而Norman Winarsky正是参与过CALO项目的关键员工。

Siri联合创始人:苹果的“语音助手”将改变世界

OK,访谈正式开始。

9to5Mac: 您在Siri扮演什么角色?

Norm: CALO项目即将结束之时,我们意识到有这当中有着难以置信的商业机会。我的任务是为这个新项目获得资金,并与Dag Kittlaus(前摩托罗拉高管) 组建团队,语义网的天才Tom Gruber和CALO的主架构师Adam Cheyer加入了我们。当苹果收购Siri之时,我们这个团队有19个人,而且正在成长。目前Siri的三位创始人仍然与其他团队成员一起在苹果从事这方面的工作。

9to5Mac: 您能告诉我们有关苹果收购的情况吗?过程如何?他们是如何评价Siri?可以告诉我们相关财务条款吗?

Norm: 根据协议,我应该对此保密,包括传言中的2亿美元收购。值得注意的是,仅仅在我们发布了我们的应用之后的2个月苹果就完成了对Siri的收购,其他的你自己想去。

9to5Mac: Nuance的语音识别技术对Siri来说有多重要?

Norm: 可能没你想象的那么重要。Siri的语音识别最初使用的是Vlingo,我们购买的语音识别组件是模块化的,在理论上,如果我们有更好的语音识别组件,我们可以轻而易举用其替代Nuance。你应该知道的是,Nuance和Siri算是兄弟公司,SRI孵化了Nuance,之后在1995年Nuance成为一家独立的公司,2000年,Nuance公开上市。

9to5Mac: Siri的人工智能需要什么样的硬件环境? 这会造成苹果延期发布下一代iPhone吗?

Norm: 我不大熟悉苹果的产品线路图,对是否延期自然也无法回答你。不过我可以告诉你的是,人工智能需要大量的计算能力,Siri软件需要对数据进行缓存,需要访问大数据集的带宽,需要一个强有力的处理器,我们最初曾经发布过基于iPhone 3GSd的Siri,为此我们不得不进行大量的优化以提升其工作效率。我想说的是,在一部更快的手机上,Siri会运行得更好。

9to5Mac: Siri ‘助手’是一项大交易吗?

Norm: 首先,我不知道什么苹果购买Siri后会怎么做。我听到的传言是,苹果正准备公布Siri在过去的一年半取得的进展(我们实际上期望是在WWDC上公布)。毫无疑问,苹果的虚拟个人助理是开创性的,甚至我要说,这是一个改变世界的事件。在技术方面,Siri至少领先竞争对手2年,这是真正的、可商用的人工智能技术。如果传言成真,苹果将使得千百万人与机器用自然语言进行交流。这仅仅是冰山的一角,我们谈论的是又一次技术革命,一种新的计算模式的转变。

这与SRI的另一个历史性项目,Doug Engelbart在60年代发明了鼠标可以相提并论。乔布斯将鼠标发扬光大,苹果将用Siri开启另一场技术革命。