voxforge数据库子集上的说话人验证协议
xbob.db.voxforge的Python项目详细描述
Voxforge提供一个用于free和open source speech recognition engines的转录语音集合。 在这个软件包中,我们设计了一个说话人识别协议,该协议使用随机选择的小部分英语音频文件(仅6561个文件),这些文件属于30个说话人。 这个子集分为三个等价的部分:训练(10个演讲者)、开发(10个演讲者)和测试(10个演讲者)集。
这个包在测试xbob.spkrec时充当说话人识别数据库的一个玩具示例。
xbob.spkrec是在idiap参与NIST SRE 2012 evaluation期间开发的。如果您使用此软件包和/或其结果,请引用以下内容 出版物:
在NIST SRE 2012研讨会上提交的原始文件:
@inproceedings{Khoury_NISTSRE_2012, author = {Khoury, Elie and El Shafey, Laurent and Marcel, S{\'{e}}bastien}, month = {dec}, title = {The Idiap Speaker Recognition Evaluation System at NIST SRE 2012}, booktitle = {NIST Speaker Recognition Conference}, year = {2012}, location = {Orlando, USA}, organization = {NIST}, pdf = {http://publications.idiap.ch/downloads/papers/2012/Khoury_NISTSRE_2012.pdf} }
bob作为运行实验的核心框架:
@inproceedings{Anjos_ACMMM_2012, author = {A. Anjos and L. El Shafey and R. Wallace and M. G\"unther and C. McCool and S. Marcel}, title = {Bob: a free signal processing and machine learning toolbox for researchers}, year = {2012}, month = oct, booktitle = {20th ACM Conference on Multimedia Systems (ACMMM), Nara, Japan}, publisher = {ACM Press}, url = {http://publications.idiap.ch/downloads/papers/2012/Anjos_Bob_ACMMM12.pdf}, }
安装
只需下载此软件包并在本地解压缩即可:
$ wget http://pypi.python.org/packages/source/x/xbob.db.voxforge/xbob.db.voxforge-0.0.1a2.zip $ unzip xbob.db.voxforge-0.0.1a2.zip $ cd xbob.db.voxforge-0.0.1a2
使用BuildOut引导并为 实验:
$ python bootstrap $ ./bin/buildout
这还要求安装bob(>;=1.2.0)。
获取数据
数据可以从其原始url(在voxforge上)下载,并通过运行download_and_untar.sh来提取,该输入接受存储数据的路径:
$ ./download_and_untar.sh PATH/TO/WAV/DIRECTORY
如果您需要帮助,请联系我们。