kaldi安装
程序员文章站
2022-05-27 19:57:49
...
文章目录
1. Ref
Kaldi官网 包括一大堆原理和工具的使用说明,有什么问题请首先看这个。
Kaldi Lecture 相比于上一个会给一个更简略的原理、流程介绍。
Kaldi中文翻译1 如果感觉英语读起来比较头疼的话建议搜一下这个来看看,是对官网上文件的翻译。这个文档来源于一个学习交流Kaldi的QQ群。
Kaldi中文翻译2
《语音识别实践》俞栋 大概是唯一能get到的中文参考书籍了吧- -涉及到初步的原理介绍。
2. 编译
主要参考[1][2]
- 检查依赖包是否齐全
[[email protected] extras]# cd tools/extras
[[email protected] extras]# ./check_dependencies.sh
./check_dependencies.sh: all OK.
- 编译tools下的文件
[[email protected] extras]# cd ../
[[email protected] tools]# make
。。。。。。
Warning: IRSTLM is not installed by default anymore. If you need IRSTLM
Warning: use the script extras/install_irstlm.sh
All done OK.
这里出现警告 IRSTLM库没有安装,其他一切OK
键入 ./extras/install_irstlm.sh 安装IRSTLM,由于可能下载不成功,请先手动下载下来后,把下载和解压等脚本注释掉,然后跑脚本,这种方式应该是可以跑过的。
- 编译src下的文件
[[email protected] tools]# cd ../src
键入 ./configure --shared检查外部库安装情况,根据提示进行安装,此步骤可以查看--help设置用不用cuda
键入 make depend 进行预编译
键入 make 或者 make all 进行编译,make耗时较长请耐心等待。
3. 测试yesno数据集
测试kaldi是否编译成功,主要参考[1][2]
cd egs/yesno/s5
./run.sh
运行结果在 egs/yesno/s5/exp/mono0a/log
s5文件夹下的内容
- conf文件夹里是一些配置文件例如MFCC的参数 HMM的拓扑结构;
- local文件夹里主要是一些准备数据的脚本,供顶层脚本run.sh调用;
- steps和utils文件夹里主要是一些运行时调用的脚本;
- data文件夹里主要存放语言模型、发音字典和音素信息等等。
❤ 致谢
【1】基于kaldi和CVTE开源模型的中文识别
【2】Kaldi安装