车音网推出基于自然语言技术的智能语音引擎

程序员文章站 2023-03-19 19:57:10

　　作为国内领先的中文语音识别技术提供商，车音网近年来在车载领域不断取得突破性进展，通过特有的商用级非特定人语音识别技术，为驾驶者提供了更加安全和便捷的智能化汽车生活方式。日前，车音网宣...

　　作为国内领先的中文语音识别技术提供商，车音网近年来在车载领域不断取得突破性进展，通过特有的商用级非特定人语音识别技术，为驾驶者提供了更加安全和便捷的智能化汽车生活方式。日前，车音网宣布正式推出拥有自主知识产权的智能语音识别引擎--AIVO。作为以车音网特有的商用级非特定人语音识别技术为底层支撑的核心产品，AIVO将为企业和终端用户带来了全新的语音应用体验，企业用户可借助开放型平台的AIVO语音引擎为产品快速添加基于自然语言识别技术的音视频内容检索、语言转文本等功能,同时不久的将来通过技术升级,AIVO引擎还将实现声纹识别、旋律搜索等更为强大的语音识别领域的技术突破，满足更全面的用户需求；而终端用户使用嵌入AIVO引擎的产品则无需手动操作，通过语音就能实现收发短信、发送远程指令和直接搜索并获取音视频内容等互联网信息，从而极大提升互动体验。

　　值得注意的是此次发布的AIVO语音引擎不仅可以应用车载领域，还适用于如移动互联网、智能家居等行业，为不同领域的企业及用户提供了更好的平台技术支撑和人机交互体验。

　　作为车音网的核心产品，AIVO语音引擎的最大亮点是其"自然语言识别"技术。相较上一代只能识别关键词指令的语音识别技术，AIVO的"自然语言理解"依托网格计算技术和非结构化的语音数据库，突破了用户口音、关键词准确性及普适性对识别率影响较大的局限，用户可以用个人习惯性的语言方式，甚至模糊的语言需求指令，就能实现人与机器的交互沟通。

　　美国《心理科学》杂志刊登的一项研究报告显示，如果声音和图像来自同一个方向（简称"耳目同向"），人们就更容易在听清楚的同时看清楚。车音网十余年坚持投入大量资金用于垂直化语言模型训练，语音识别率大幅度提升，高达90%以上。通过AIVO语音引擎的自然语言识别技术，驾驶者可以以安全易于操控的方式将语言快速转换成文字，在遵守"手眼同向"法则下收听、编写邮件或短信。

　　AIVO语音引擎的另一大创新还在于行业领先的人工智能技术和海量知识库导入，实现了双向或多向的实时音视频内容检索服务。该检索服务彻底重构了当下单向度的信息检索方式，并将颠覆现有用户搜索习惯，标志着语义搜索引擎的商业化进程取得了新的突破。AIVO引擎的音视频检索功能区别于当前按关键词标注的单向文本检索，可对海量音视频库中的音频进行快速准确的基于语音内容的自动索引、关键音检索及语音识别。使用AIVO引擎语音检索音乐文件，结合特有的节拍或旋律识别，不仅能帮助用户轻松搜索到音乐文件，还能识别歌曲的名称、制作者、演唱者、专辑等背景信息，甚至告诉用户歌曲的风格是悲伤的还是欢快的。相信不久的将来，这一人工智能技术将广泛应用于互联网、电视媒体及智能电视领域，并让我们的生活充满更多乐趣。

上一篇：这些学生,满脑子的歪才

下一篇：大学宿舍最常听到的话。