计算Pythorch中的短期目标可懂度
torch-stoi的Python项目详细描述
STOI的PyTorch实现
实现了经典和扩展的短消息 Pythorch术语的客观可懂度。 另请参见Cees Taal's website和 python implementation
安装
pip install torch_stoi
重要警告
此实现仅用作丢失函数。
它没有复制原始度量的精确行为
但结果应该足够接近,以便可以使用
作为损失函数。请参阅中的注释
^{
定量比较很快就会有希望:火箭:
用法
^{pr2}$比较NumPy和PyTorch版本:静态测试
使用NumPy版本获得的值将与 下图中的Pythorch版本。在
8kHz
经典斯托伊测量
在
扩展STOI测度
在
<16kHz经典斯托伊测量
在
扩展STOI测度
在
用于比较两种版本的16kHz信号包含很多 沉默,这解释了为什么没有 VAD公司。在
比较NumPy和PyTorch版本:训练DNN
在不久的将来
参考文献
- [1] C.H.Taal,R.C.Hendriks,R.Heusdens,J.Jensen'A短期 时频加权噪声语音的客观可懂度测量', ICASSP2010,德克萨斯州,达拉斯。在
- [2] C.H.Taal,R.C.Hendriks,R.Heusdens,J.Jensen'An算法 时频加权噪声语音的可懂度预测', IEEE音频、语音和语言处理汇刊,2011年。在
- [3] J.Jensen和C.H.Taal,'一种预测 调制噪声掩蔽器掩蔽语音的可懂度, IEEE音频、语音和语言处理事务,2016年。在
- 项目
标签: