我正在使用库Soundfile(它使用库libsndfile)进行数字声音处理。它有读取音频文件的功能,声音文件.read(). 可以这样使用:
import soundfile as sf
input_file, sampling_rate_orig = sf.read(Path)
音频文件的输出样本映射到(-1,1)范围,我的两个问题是:
1)应用什么样的比例/标准化来获得该映射?
2)为什么允许某些样品超过此限值?
解释2):当读取60个持续时间为3秒、采样率为22050 Hz的不同音频文件时,在总共3969000(60*3*22050)个样本中,有51个样本的值大于1。负极限也是如此。36个样本小于-1。你知道吗
谢谢你的帮助
好吧,@bastibe,Github上声音文件存储库的所有者,以一种精确而清晰的方式为我回答了这个问题。 以下是线程的链接:
https://github.com/bastibe/SoundFile/issues/226
相关问题 更多 >
编程相关推荐