欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

宝马携科技公司升级车载语音系统 可识别方言

程序员文章站 2022-12-02 22:28:24
车载语音助理终于想着要听懂方言了,只不过还不是咱们这儿的方言。本周,宝马、三星、松下三家公司宣布要和语音识别公司 Nuance 合作升级现有的语音个人助理。除了要分辨楚纽约,还是德州口音之外,新的技术...

车载语音助理终于想着要听懂方言了,只不过还不是咱们这儿的方言。

本周,宝马、三星、松下三家公司宣布要和语音识别公司 Nuance 合作升级现有的语音个人助理。除了要分辨楚纽约,还是德州口音之外,新的技术还想搞清楚司机到底是在和朋友聊天,还是在向它发出指令。

但事实上,你现在对着 Siri 说稍微长一点的句子,它都理解不了。而语言环境又每年都在变换,比如今年自称”宝宝“这种玩法,一定会玩坏不少语音助手。

把难题交给 Nuance 或许是目前最正确的选择。iPhone 4S 发布开始,它为 iOS 原生语音识别软件 Siri 提供技术支持。同时,Google Now、微软小娜也都是它的客户。

Nuance 是目前全球规模最大的语音识别公司。它还有一些产品,包括图像识别和输入法。苹果应用商店中,你能搜到 15 个来自这家公司的应用。宝马现在的车载导航语音识别系统,用到的是它的 Dragon Dictate 。

国内公司中,科大讯飞也是做同样的事情,但少了近 10 年的数据和技术积累。

2005 年,做电话会议系统的 Nuance Communication 和人工智能公司 ScanSoft 合并,成立了 Nuance。它们决定将语音识别技术市场化。

宝马携科技公司升级车载语音系统 可识别方言

在此之前,负责计算机算法的软件公司 ScanSoft 最主要的技术是图像识别,帮助扫描仪优化输出结果。但这家公司的灵魂是一位叫做 Ray Kurzweil 的麻省理工毕业生。

大二时,Kurzweil 设计过一套帮大学审核申请资质的算法,拿全美高中生的申请材料匹配入学要求。项目火了之后,他却把项目和公司都卖了。在 1968 年挣到了第一桶金 10 万美元,并一战成名。

后来,他还陆陆续续地发明一些实用的技术。比如能识别所有字体的文章、让计算机读出屏幕上显示的文字。应用之后,它们分别都成了更精准的扫描仪和电脑上帮助视障人士的听写功能。

另外,没有他,像 OWl City 之类的电子音乐创作人也就没得玩了。1984 年他发明的音乐系统能模拟钢琴之外更多乐器的声音。

从 1974 开始,Kurzweil 不断发明新技术,不断地成立和转手公司。到今天,他还是 Nuance 公司的高级技术顾问,也是 Google 的技术总监。

不过,如果今天你听说过 Ray Kurzweil,他更多是那位在 TED 演讲中 “危言耸听”的未来学家。到 2020 年人体可再编程重组,是他的一个预言。

题图来自 电影《她》剧照