欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

Google 承认利用用户数据改进语音识别功能

程序员文章站 2022-03-15 11:41:41
    据TNW报道,Google今天发布了一篇名为“LargeScaleLanguageModelinginAutomaticSpeechRecogni...

    据TNW报道,Google今天发布了一篇名为“LargeScaleLanguageModelinginAutomaticSpeechRecognition(PDF).”的通知,承认Google利用其用户带来的大量网络数据——也就是Google.com上面的数据——来更新自动语音识别软件。

   Google语音搜索通过机器识别和智能分析,可以识别用户快速说出的搜索词,用户还可以点击下拉框,矫正、修改关键词。利用大量数据背后的语言模式来统计不同文字的使用率,以网络上已有的的对话样本为基础。

   庞大的语言模型对语音识别功能服务的开发和更新而言非常有用处,比如语音搜索功能和少数YouTube的语音转录服务,可以使用元语法(n-gram)来探寻语言模式的内涵。然后强调使用更多数据对以上两种功能进行“训练“的益处。具体使用情况取决于服务本身的可用性和数据量的使用情况。

Google 承认利用用户数据改进语音识别功能

   上图为利用语言模型数据更新之后,Google上语言错误率和搜索错误率出现的情况,很明显呈下降趋势。

   以上的意义在于,当你说“天气真好,我要出……”的时候,优秀的语音识别软件会判断后面极有可能是“门”或者“去”,而不是“老千”。