语音识别装置以及语音识别方法

程序员文章站 2022-09-18 19:50:12

语音识别装置以及语音识别方法　　申请专利号 CN03157364.9 　专利申请日 2003.09.18 　名称...

语音识别装置以及语音识别方法　　

申请专利号 CN03157364.9 　

专利申请日 2003.09.18 　

名称语音识别装置以及语音识别方法　　

公开（公告）号 CN1492394

公开（公告）日 2004.04.28 　

类别物理

颁证日　

优先权 2002.9.18 JP 271670/2002

申请（专利权）日本先锋公司　

地址日本东京　

发明（设计）人外山聪一　

国际申请

国际公布

进入国家日期　

专利代理机构北京三友知识产权代理有限公司　

代理人李辉　

摘要

本发明的语音识别装置和语音识别方法目的在于减低杂音适应处理和发话者适应处理时的处理量。事先记忆代表语音模型C和差分模型D。实行语音识别前，对代表语音模型C施行杂音适应处理以生成杂音适应代表语音模型C

主权项

1.一种语音识别装置，其将实施了杂音适应处理和发话者适应处理的合成语音模型与自发话时的发话语音求得的特征矢量系列进行对照来实行语音识别，其特征在于包括：记忆手段，其通过小组化或群集化且根据类似性把多数的语音模型分类成若干小组，且能够预先记忆自通过小组化或群集化而属于同一小组的每个小组的语音模型代表性地求得的各小组的代表语音模型、通过按上述各同一小组来求得属于上述各组的语音模型与上述代表语音模型之间的差分而得到的且属于各小组的差分模型、使上述代表语音模型和差分模型对应于各同一小组的小组信息；杂音适应代表语音模型生成手段，其通过对记忆在上述记忆手段中的每个同一小组的代表语音模型实行杂音适应处理来生成杂音适应代表语音模型；合成语音模型生成手段，其根据上述小组信息按上述每个同一小组把属于上述各小组的上述差分模型与上述杂音适应代表语音模型进行合成，从而生成每个同一小组的合成语音模型；更新模型生成手段，其对于实施过上述杂音适应处理的上述每个同一小组的合成语音模型，根据自发话语音求得的特征矢量系列施行发话者适应处理，从而生成杂音发话者适应语音模型；模型更新手段，从上述杂音发话者适应语音模型与根据上述小组信息选择的上述杂音发话者适应语音模型所属的小组的上述杂音适应代表语音模型之间的差分来生成上述每个同一小组的更新差分模型，同时按照该生成的更新差分模型来更新上述记忆手段中记忆的每个同一小组的差分模型；在语音识别时，通过对根据上述小组信息选择的上述更新差分模型所属的小组的上述代表语音模型实施杂音适应处理来生成杂音适应代表语音模型，同时将杂音适应代表语音模型与上述更新的更新差分模型进行合成来生成实施过杂音适应处理和发话者适应处理的合成语音模型，并且通过把该合成语音模型与自要被识别的发话者语音求得的特征矢量系列进行对照来实行上述语音识别。　

上一篇：新鲜搞笑的情人节短信集锦

下一篇：极具幽默感的老夫老妻

语音识别装置以及语音识别方法

微信公共服务平台开发（.Net 的实现）4-------语音识别

人工智能驱动互联网“下一季” 语音识别构建新生态入口

python实现百度语音识别api

客户体验的未来：类Siri语音识别和身份验证

IBM人脑模拟芯片可使手机轻松识别语音

声卡驱动问题引起语音聊天异常的原因以及解决办法

Android实现语音识别代码

“一语即达”，信美相互智能语音识别功能上线

语音识别工具

谷歌开源Live Transcribe语音识别转文字工具