语音识别装置以及语音识别方法
语音识别装置以及语音识别方法
申请专利号 CN03157364.9
专利申请日 2003.09.18
名称 语音识别装置以及语音识别方法
公开(公告)号 CN1492394
公开(公告)日 2004.04.28
类别 物理
颁证日
优先权 2002.9.18 JP 271670/2002
申请(专利权) 日本先锋公司
地址 日本东京
发明(设计)人 外山聪一
国际申请
国际公布
进入国家日期
专利代理机构 北京三友知识产权代理有限公司
代理人 李辉
摘要
本发明的语音识别装置和语音识别方法目的在于减低杂音适应处理和发话者适应处理时的处理量。事先记忆代表语音模型C和差分模型D。实行语音识别前,对代表语音模型C施行杂音适应处理以生成杂音适应代表语音模型C
主权项
1.一种语音识别装置,其将实施了杂音适应处理和发话者适应处理 的合成语音模型与自发话时的发话语音求得的特征矢量系列进行对照来 实行语音识别,其特征在于包括: 记忆手段,其通过小组化或群集化且根据类似性把多数的语音模型 分类成若干小组,且能够预先记忆自通过小组化或群集化而属于同一小 组的每个小组的语音模型代表性地求得的各小组的代表语音模型、通过 按上述各同一小组来求得属于上述各组的语音模型与上述代表语音模型 之间的差分而得到的且属于各小组的差分模型、使上述代表语音模型和 差分模型对应于各同一小组的小组信息; 杂音适应代表语音模型生成手段,其通过对记忆在上述记忆手段中 的每个同一小组的代表语音模型实行杂音适应处理来生成杂音适应代表 语音模型; 合成语音模型生成手段,其根据上述小组信息按上述每个同一小组 把属于上述各小组的上述差分模型与上述杂音适应代表语音模型进行合 成,从而生成每个同一小组的合成语音模型; 更新模型生成手段,其对于实施过上述杂音适应处理的上述每个同 一小组的合成语音模型,根据自发话语音求得的特征矢量系列施行发话 者适应处理,从而生成杂音发话者适应语音模型; 模型更新手段,从上述杂音发话者适应语音模型与根据上述小组信 息选择的上述杂音发话者适应语音模型所属的小组的上述杂音适应代表 语音模型之间的差分来生成上述每个同一小组的更新差分模型,同时按 照该生成的更新差分模型来更新上述记忆手段中记忆的每个同一小组的 差分模型; 在语音识别时,通过对根据上述小组信息选择的上述更新差分模型 所属的小组的上述代表语音模型实施杂音适应处理来生成杂音适应代表 语音模型,同时将杂音适应代表语音模型与上述更新的更新差分模型进 行合成来生成实施过杂音适应处理和发话者适应处理的合成语音模型, 并且通过把该合成语音模型与自要被识别的发话者语音求得的特征矢量 系列进行对照来实行上述语音识别。
下一篇: "饭局"二字新定义