语音识别装置以及语音识别方法

程序员文章站 2022-04-01 22:35:30

语音识别装置以及语音识别方法　　申请专利号 CN03157364.9 　专利申请日 2003.09.18 　名称...

语音识别装置以及语音识别方法　　

申请专利号 CN03157364.9 　

专利申请日 2003.09.18 　

名称语音识别装置以及语音识别方法　　

公开（公告）号 CN1492394

公开（公告）日 2004.04.28 　

类别物理

颁证日　

优先权 2002.9.18 JP 271670/2002

申请（专利权）日本先锋公司　

地址日本东京　

发明（设计）人外山聪一　

国际申请

国际公布

进入国家日期　

专利代理机构北京三友知识产权代理有限公司　

代理人李辉　

摘要

本发明的语音识别装置和语音识别方法目的在于减低杂音适应处理和发话者适应处理时的处理量。事先记忆代表语音模型C和差分模型D。实行语音识别前，对代表语音模型C施行杂音适应处理以生成杂音适应代表语音模型C

主权项

1.一种语音识别装置，其将实施了杂音适应处理和发话者适应处理的合成语音模型与自发话时的发话语音求得的特征矢量系列进行对照来实行语音识别，其特征在于包括：记忆手段，其通过小组化或群集化且根据类似性把多数的语音模型分类成若干小组，且能够预先记忆自通过小组化或群集化而属于同一小组的每个小组的语音模型代表性地求得的各小组的代表语音模型、通过按上述各同一小组来求得属于上述各组的语音模型与上述代表语音模型之间的差分而得到的且属于各小组的差分模型、使上述代表语音模型和差分模型对应于各同一小组的小组信息；杂音适应代表语音模型生成手段，其通过对记忆在上述记忆手段中的每个同一小组的代表语音模型实行杂音适应处理来生成杂音适应代表语音模型；合成语音模型生成手段，其根据上述小组信息按上述每个同一小组把属于上述各小组的上述差分模型与上述杂音适应代表语音模型进行合成，从而生成每个同一小组的合成语音模型；更新模型生成手段，其对于实施过上述杂音适应处理的上述每个同一小组的合成语音模型，根据自发话语音求得的特征矢量系列施行发话者适应处理，从而生成杂音发话者适应语音模型；模型更新手段，从上述杂音发话者适应语音模型与根据上述小组信息选择的上述杂音发话者适应语音模型所属的小组的上述杂音适应代表语音模型之间的差分来生成上述每个同一小组的更新差分模型，同时按照该生成的更新差分模型来更新上述记忆手段中记忆的每个同一小组的差分模型；在语音识别时，通过对根据上述小组信息选择的上述更新差分模型所属的小组的上述代表语音模型实施杂音适应处理来生成杂音适应代表语音模型，同时将杂音适应代表语音模型与上述更新的更新差分模型进行合成来生成实施过杂音适应处理和发话者适应处理的合成语音模型，并且通过把该合成语音模型与自要被识别的发话者语音求得的特征矢量系列进行对照来实行上述语音识别。　

上一篇： IBM Waston来了，苹果siri颤抖了

下一篇：＂饭局＂二字新定义

语音识别装置以及语音识别方法

iOS10语音识别框架SpeechFramework应用详解

Android使用百度语音识别的示例代码

iOS10语音识别框架SpeechFramework应用详解

Android使用百度语音识别的示例代码

为textView添加语音输入功能的实例代码(集成讯飞语音识别)

C#语音识别用法实例

微信公众平台开发之语音识别.Net代码解析

MinGW安装图文教程以及如何配置C语音编程环境

HTML5语音识别标签写法附图

如何用声音来操控IE浏览器及语音识别引擎的使用