ICRoute 语音识别芯片/声控芯片 用声音去沟通 语音识别技术介绍
语音识别ASR现实意义:
ASR技术最重要的现实意义就在于提供了一种脱离按键,键盘,鼠标,触摸屏等GUI操作方式,基于语音的用户界面 VUI : Voice User Interface。
使得用户对于产品的操作更快速,更自然。
对于ICRoute的语音识别芯片LD332X,只需要在主控MCU的程序中设定好要识别的关键词语列表,并动态地把这些关键词语以字符的形式传送到芯片LD332X 内部,就可以对用户说出的关键词语进行识别。不需要用户作任何地录音训练。
用户可以下载,来了解LD332X芯片可以完成的功能,避免对语音识别技术出现误解。
非特定人(SI:Speaker Independent ASR)语音识别功能:
非特定人语音识别技术ASR,是对几十G的语音数据(相当于对数千人采集的数万小时的有效声音数据)经语言学家语音模型分析,科学家建立数学模型,并经过反复训练提取基元语音的细节特征,以及提取各基元间的特征差异。可以得到在统计概率最优化意义上的各个基元语音特征。最后才由资深工程师将算法以及语音模型转化为硬件芯片以应用在嵌入式系统中。
对比旧有的“语音标签”技术:
语音标签实际上采用的是特定人语音识别技术(Speaker-Dependent ASR),就是针对某一用户的声音,进行录音和简单提取语音特征,作为识别匹配的基准。语音标签实用效果很差,对于不同的用户的声音不具有普适性的识别能力,即使对于同一用户,也会出现由于感冒,运动等原因造成的声音出现变声而导致识别失败。其主要原因在于语音标签技术的算法架构简单,语音模型粗略,搜索引擎简化,训练算法失真,无法提取真正有效的语音特征作为识别特征。
基于领先的语音识别核心引擎,经过在各大主流手机产品中三年来超过一千万份的量产检验,LD332X提供了可以真正实用的非特定人语音识别/声控功能。
下一篇: 语音识别将成为2012年热门安防应用之一