与kaldi asr nnet3/chain和gmm解码器的简单python/cython接口
py-kaldi-asr的Python项目详细描述
#py kaldi asr
kaldi asr的一些简单包装旨在使使用kaldi的在线nnet3链解码器尽可能方便。Kaldi的在线GMM解码器也受支持。
使用来自[Zamia Speech]项目(http://zamia-speech.org/)的预先培训模块开始。在那里,您还可以找到一个教程,其中包含指向预构建二进制软件包的链接,以便在几分钟内启动并运行免费和开源的语音识别:
[Zamia语音教程](https://github.com/gooofy/Zamia Speech开始使用我们的预培训模型)
代码
----
简单wav文件解码:
`` python
来自kaldiasr.nnet3导入kaldinet3联机模型,Kaldinet3联机解码器
MODELDIR='数据/模型/kaldi-generic-en-tdnn-sp-latest'
wav file='数据/dw961.wav'
kaldi-u模型=Kaldinet3联机模型(MODELDIR)
解码器=Kaldinet3联机解码器(kaldi-u模型)
if decoder.decode-wav-u文件(WAVFILE):
sL=解码器。获取解码的字符串()
print
print u“**************************************************
print u“**”,wavfile
print u“**”,s
print u“**%s可能性:”%modeldir,
print u********************************************************************************************************************************
print
prin
prin打印打印打印“***错误:解码%s失败。”%wavfile
`
请查看示例目录以获取更多示例代码。有关示例代码的详细示例代码,请查看示例目录。
====
*python 2.7或3.5
*numpy
*cython
*[kaldi-asr](http://kaldi-asr.org/“kaldi-asr.org”)
setup notes
==
source
----
在编写本文时,kaldi-asr似乎没有在系统上安装它的正式方法。
所以,目前,我们将依赖pkg config提供libs和cflags进行编译:
在pkg config路径中的某个位置创建一个名为“kaldi asr.pc”的文件,该文件提供
此信息:
``bash
kaldi root=/opt/kaldi
name:kaldi asr
描述:kaldi asr语音识别工具包
版本:5.2
需要:图集
libs:-l${kaldi根}/tools/openfst/lib-l${kaldi根}/src/lib-lkaldi译码器-lkaldi lat-lkaldi fstext-lkaldi hmm-lkaldi feat-lkaldi-lkaldi变换-lkaldi gmm-lkaldi树-lkaldi util-lkaldi矩阵-lkaldi基-lkaldi-nnent3-lkaldi-online2-lkaldi cudamatrix-lkaldi-lkaldi矩阵-lkaldi矩阵-lkaldi基-lkaldi-nnent3-lkaldi-online2-lkaldi-lkaldi cudamatrix-lkaldi cudamadicudamatrix-lkaldi u根}/src-i${kaldi_root}/tools/openfst/include
```
确保“kaldi_root”指向文件系统中kaldi签出所在的位置。
----
>即使不需要安装atlas头来编译kaldi,也可能需要安装atlas头。
````
$sudo apt installlibatlas dev
```
许可证
==
除非脚本的版权
标题中另有说明,否则我自己的代码是apache许可的。
有些脚本和文件基于其他人的作品,在这种情况下,我的意图是保持原始许可证的完整性。请确保检查内部的
版权标题以获取更多信息。
作者
==
Guenter Bartsch<;Guenter@zamia.org>;
Kaldi 5.1改编由mariasmo提供https://github.com/mariasmo<;br/>;
Kaldi GMM模型支持由David Zurow提供https://github.com/daanzu<;br/>;
kaldi asr的一些简单包装旨在使使用kaldi的在线nnet3链解码器尽可能方便。Kaldi的在线GMM解码器也受支持。
使用来自[Zamia Speech]项目(http://zamia-speech.org/)的预先培训模块开始。在那里,您还可以找到一个教程,其中包含指向预构建二进制软件包的链接,以便在几分钟内启动并运行免费和开源的语音识别:
[Zamia语音教程](https://github.com/gooofy/Zamia Speech开始使用我们的预培训模型)
代码
----
简单wav文件解码:
`` python
来自kaldiasr.nnet3导入kaldinet3联机模型,Kaldinet3联机解码器
MODELDIR='数据/模型/kaldi-generic-en-tdnn-sp-latest'
wav file='数据/dw961.wav'
kaldi-u模型=Kaldinet3联机模型(MODELDIR)
解码器=Kaldinet3联机解码器(kaldi-u模型)
if decoder.decode-wav-u文件(WAVFILE):
sL=解码器。获取解码的字符串()
print u“**************************************************
print u“**”,wavfile
print u“**”,s
print u“**%s可能性:”%modeldir,
print u********************************************************************************************************************************
prin
prin打印打印打印“***错误:解码%s失败。”%wavfile
`
请查看示例目录以获取更多示例代码。有关示例代码的详细示例代码,请查看示例目录。
====
*python 2.7或3.5
*numpy
*cython
*[kaldi-asr](http://kaldi-asr.org/“kaldi-asr.org”)
setup notes
==
source
----
在编写本文时,kaldi-asr似乎没有在系统上安装它的正式方法。
所以,目前,我们将依赖pkg config提供libs和cflags进行编译:
在pkg config路径中的某个位置创建一个名为“kaldi asr.pc”的文件,该文件提供
此信息:
``bash
kaldi root=/opt/kaldi
name:kaldi asr
描述:kaldi asr语音识别工具包
版本:5.2
需要:图集
libs:-l${kaldi根}/tools/openfst/lib-l${kaldi根}/src/lib-lkaldi译码器-lkaldi lat-lkaldi fstext-lkaldi hmm-lkaldi feat-lkaldi-lkaldi变换-lkaldi gmm-lkaldi树-lkaldi util-lkaldi矩阵-lkaldi基-lkaldi-nnent3-lkaldi-online2-lkaldi cudamatrix-lkaldi-lkaldi矩阵-lkaldi矩阵-lkaldi基-lkaldi-nnent3-lkaldi-online2-lkaldi-lkaldi cudamatrix-lkaldi cudamadicudamatrix-lkaldi u根}/src-i${kaldi_root}/tools/openfst/include
```
确保“kaldi_root”指向文件系统中kaldi签出所在的位置。
>即使不需要安装atlas头来编译kaldi,也可能需要安装atlas头。
````
$sudo apt installlibatlas dev
```
许可证
==
除非脚本的版权
标题中另有说明,否则我自己的代码是apache许可的。
有些脚本和文件基于其他人的作品,在这种情况下,我的意图是保持原始许可证的完整性。请确保检查内部的
版权标题以获取更多信息。
作者
==
Guenter Bartsch<;Guenter@zamia.org>;
Kaldi 5.1改编由mariasmo提供https://github.com/mariasmo<;br/>;
Kaldi GMM模型支持由David Zurow提供https://github.com/daanzu<;br/>;