ExKaldi自动语音识别工具包
exkaldi的Python项目详细描述
ExKaldi:Python的kaldi包装器
ExKaldi自动语音识别工具包是为了在Kaldi和Python之间建立一个接口而设计的。 与其他kaldi包装不同,exkaldi具有以下特点:
- 在
集成api构建ASR系统,包括HMM-GMM声学模型训练、HMM-DNN声学模型训练、N-grams语言模型训练与查询、解码与评分。在
在 - 在
ExkDelC++库设计支持,如CTC端到端解码。在
在 - 在
使用KenLm作为语言模型后端。在
在 - 在
支持本地主机与linux服务器之间的通信(Exkaldi的理想环境是linux服务器)。在
在
安装
- 如果尚未安装Kaldi ASR toolkit,请首先克隆Kaldi ASR toolkit存储库。在
git clone https://github.com/kaldi-asr/kaldi.git kaldi --origin upstream
然后按照这三个教程文件进行安装和编译。在
^{pr2}$- 您可以从PyPi库安装ExKaldi工具包。在
pip install exkaldi
但是我们建议您可以从我们的github项目中克隆ExKaldi源代码,然后安装它。在
git clone https://github.com/wangyu09/exkaldi.git
cd exkaldi
bash quick_install.sh
- 检查安装是否正确。在
python -c "import exkaldi"
教程
我们准备了一些教程来演示如何在Exkaldi/examples目录中使用exkaldiapi。在
1。config exkaldi
2。extract and process acoustic feature
3。prepare lexicons
4。train and query a N-grams language model
5。train monophone HMM-GMM
6。train decision tree
7。train triphone HMM-GMM (train delta)
8。make HCLG decoding graph
9。decode based on HMM-GMM and HCLG
10。process lattice and score
11。train DNN acoustic model with Tensorflow 2.x
12。decode based on HMM-DNN and HCLG
Cehck源代码来查找更多关于exkaldi api的信息。在
- 项目
标签: