UPB通信工程系公用事业收集
paderbox的Python项目详细描述
Paderbox:用于音频/语音处理的实用程序集合
该存储库于2014年底开始作为德国帕德伯恩大学Communications Engineering Group的内部开发存储库。 多年来,它出现了一个IO helper、feature extraction模块和许多小型工具的集合,这些工具为Numpy、Pandas等添加了功能。在
这里的主要目的是限制other public repositories上的代码重复。在
我们确保大多数函数/类都包含Python docstring,以便支持大多数函数的自动工具提示。 它是故意反对冗长的文档:大多数重点放在Python docstring和代码本身的可读性上。在
示例
在不讨论所有函数的情况下,我们在这里选择两个示例来说明为什么我们依赖于这种实现。在
短时傅里叶变换
短时傅立叶变换(STFT)是处理语音、语音等时间序列的一种常用的特征提取方法。 大多数存储库,包括像TensorFlow这样的深度学习框架,都提供了STFT实现。 然而,很少有人看到,这些实现允许在应用STFT后应用逆STFT时进行精确重建。在
经常被监督的两个重要问题是:
- 当使用anySTFT window函数时,如何计算双正交重建窗口?在
- 根据STFT窗口长度、DFT长度和偏移需要多少填充来补偿淡入、淡出和不均匀信号长度?在
我们的STFT implementation解决了上述问题,可以在任何数量的独立维度上运行,并且自2015年以来已经在我们的音频/语音出版物中进行了战斗测试。 大量的STFT tests确保代码保持稳定,尤其是测试上述问题。在
快速访问IPython音频播放器
函数paderbox.play.play()
是一个围绕IPython.display.Audio
精心设计的包装器。
一个单一的功能允许播放来自波形、STFT信号和文件的音频。
因此,它是Jupyter笔记本电脑中的一个很好的工具,有助于快速检查模拟结果。在
安装
用pip从PyPI安装它
pip install paderbox[all]
[all]
标志是可选的,指示安装所有依赖项。
当你想拥有最小的依赖性时,删除它。在
或者,您可以克隆此存储库并按如下方式安装它
^{pr2}$如何引证?在
如何引用这个资料库进行研究,目前还没有明确的方法。 但是,如果您使用STFT,我们将非常感谢您从该存储库直接导入。 当您复制代码时,只要它在您复制代码的位置保持可见,我们也可以。在
如果您使用我们的其他资料库依赖这项工作,如果您尊重该资料库的引文提示,我们将不胜感激。在
- 项目
标签: