声音文件库，读取文件时的振幅范围

2024-05-18 23:43:53 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在使用库Soundfile（它使用库libsndfile）进行数字声音处理。它有读取音频文件的功能，声音文件.read(). 可以这样使用：

import soundfile as sf
input_file, sampling_rate_orig = sf.read(Path)

音频文件的输出样本映射到（-1,1）范围，我的两个问题是：

1）应用什么样的比例/标准化来获得该映射？

2）为什么允许某些样品超过此限值？

解释2）：当读取60个持续时间为3秒、采样率为22050 Hz的不同音频文件时，在总共3969000（60*3*22050）个样本中，有51个样本的值大于1。负极限也是如此。36个样本小于-1。你知道吗

谢谢你的帮助

Tags： import 功能声音 read input as 数字 sf

1条回答

网友

1楼 · 发布于 2024-05-18 23:43:53

好吧，@bastibe，Github上声音文件存储库的所有者，以一种精确而清晰的方式为我回答了这个问题。以下是线程的链接：