谷歌将开放语音识别API 对抗Nuance

程序员文章站 2022-03-15 11:29:22

3月24日消息，据科技博客TechCrunch报道，谷歌计划向第三方开发者开放其语音识别API，与Nuance及其它的语音识别公司竞争。为了吸引开发者，该API一开始将免费提供。有关该服务的消息已经传...

3月24日消息，据科技博客TechCrunch报道，谷歌计划向第三方开发者开放其语音识别API，与Nuance及其它的语音识别公司竞争。为了吸引开发者，该API一开始将免费提供。

有关该服务的消息已经传了好几周。该公司今天在NEXT云用户大会上正式公布了该项服务。

谷歌表示，谷歌云语音API（Google Cloud Speech API）将覆盖超过80种语言，兼容任何实时串流或者批处理模式的应用，它将为应用程序提供一整套API，给它们带来“看、听与翻译”方面的功能。它基于目前驱动谷歌应用的语音搜索和谷歌键盘的语音输入的神经网络技术。它还有一些其它有趣的功能，如可在嘈杂的环境运行，支持实时运行。

谷歌的这一举措将会对整个行业产生不小的影响——尤其是对Nuance。长期以来，Nuance一直被认为是业界最好的语音识别技术提供商，它也是该领域最大的一家公司。鉴于谷歌提供的体验比现有提供商要好，而且定价较低，包括创业公司在内的众多Nuance客户有可能会转投谷歌技术的怀抱。

为了引起开发者的兴趣，谷歌的语音识别API一开始将完全免费提供。未来它将要收费，但价格很可能会比较低。谷歌可能会在成为该行业的主导者之后再上调服务价格。

截至目前为止，谷歌在其产品中提供的语音技术访问权限十分有限。该公司在去年的I/O大会上发布了一款语音交互API，让Android开发者可以为他们的应用加入语音交互功能。不过，谷歌尚未直接开放它的语音识别API。

而语音识别API的推出，将不仅仅影响到Nuance和其它的语音识别技术提供商，也将会对苹果造成冲击。苹果虚拟助手Siri的语音识别功能并不如谷歌的。苹果目前也没有通过提供API让开发者在他们的应用中使用Siri技术。

种种迹象显示，谷歌似乎变得更加注重语音技术和众多的使用案例。例如，该公司在2月宣布将允许Google Docs用户通过语音来编辑和设计文档。（皓慧）

上一篇：谷歌开放语音识别API，发力人工智能

下一篇： “消灭”键盘百度打造新一代智能语音搜索