timit数据库的方便python包装器。

timit-utils的Python项目详细描述


胆小

简而言之,timit数据库包含对所说句子的录音。 一群人。它还包括单词和音素转录,以及 它们在音频文件中的确切位置,如范围。

因此,它是ml的一个有趣的目标:我们可以获得高质量的音频记录,以及实时的音素和单词转录(或者猜测它们)。

实际的timit数据库不包括在内,也不是免费的。到这里来: https://catalog.ldc.upenn.edu/LDC93S1。这个库只是添加 方便、解析、采样、绘图等。

alt text

胆小的实用程序

这里的代码可以惰性地加载、解析和公开timit数据库 口头录音,文字和音素记录。timit文件系统的布局如下:

alt text

这个库用几个类来模拟数据:

  • 语料库(如'../timit',包含两个子类:训练和测试)
  • 亚形态(例如“train”“test”,包含多个区域)
  • 区域(如“DR1”,包含多个人)
  • 人(例如“姓名:cjf0,女性”)
  • 句子(如“sa1”,包含音频、单词和音素转录,作为numpy数组)

所有这些都提供了许多方法来索引、迭代、解析、搜索数据,并将数据公开为pandas数据帧。

  • 各种音频采样、填充例程、mel filterbank频率提取和快速显示系统

安装

pip install timit_utils

胆小的实用程序需要numpy、pandas、matplotlib、scipy、python语言特性和soundfile。

示例用法(即在jupyter中)

%matplotlib inline
import timit_utils as tu
import timit_utils.audio_utils as au
import timit_utils.drawing_utils as du

corpus = tu.Corpus('../TIMIT')
sentence = corpus.train.sentences_by_phone_df('aa').sentence[0]
du.DrawVerticalPanels([du.AudioPanel(sentence.raw_audio, show_x_axis=True),
                       du.WordsPanel(sentence.words_df, sentence.raw_audio.shape[0], show_x_axis=True),
                       du.PhonesPanel(sentence.phones_df, sentence.raw_audio.shape[0])
                      ])

此处完全使用: https://github.com/colinator/timit_utils/blob/master/timit_utils_demonst.ipynb

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在IntelliJ中导入Gradle项目?   java使用dropwizard在ContainerResponseFilter上注入HttpServletRequest HttpServletRequest   基于Java的简单规则引擎的回退实现   java无法在引号“”中获取字符串值(Android)   直接从java书籍中复制的用户界面代码不希望运行   java如何检查已安装的libevent版本?   javascript如何在CryptoJS中解密文件,由JAVA使用AES加密   如何为自制软件打包Java GUI应用程序   java IntelliJ,在调试模式下运行glassfish,未部署工件   swing重新打开以前关闭的窗口Java   带参数的java测试资源   此URL不支持java HTTP Status 405 HTTP方法GET,即使没有doget()方法   java Heroku应用程序使用s3上传图像   java使两个水平文本视图在一起小于某个宽度时保持左侧,但如果它们大于宽度,则省略左侧视图?   Thymeleaf中的java绑定列表;索引超出范围   java类型JspWriter中的print(boolean)方法不适用于参数   java安卓要么没有足够的内存用于后台任务,要么GC有问题   如何使用证书过期的旧java小程序?   java如何从事件中获取数据到主函数?