应用傅里叶变换后处理scipy.io波形文件的问题
我正在用Python处理一些音频文件,主要使用的是scipy.fftpack和scipy.io这两个库。简单来说,我有一些波形文件(wav文件),我把它们导入进来,然后用傅里叶变换对它们进行一些操作,最后再输出成新的波形文件。不过,我遇到了一些问题,就是在进行这些变换后,生成的波形文件无法播放,而且文件大小大约是原文件的四倍。
目前,我只是导入歌曲,获取采样率和数据部分,然后对数据进行ifft(fft(data))操作,最后输出这个结果。我还尝试把这些浮点数值转换成整数,并计算导入的数据和ifft(fft(data))之间的差异,结果发现差异正好是零。
所以我有以下几个问题:
有没有人知道为什么我在进行傅里叶变换后尝试播放的波形文件无法播放?
波形文件是否有任何限制,可能导致出现问题?或者说数据必须是整数吗?
现在有点晚了,我觉得我的帖子可能有点乱,如果你需要更多信息,请问我,我会尽量提供更好的描述。
1 个回答
4
你需要在处理完数据后,把它转换成合适位数的整数类型。以这个文件为例:
>>> import scipy.io.wavfile
>>> rate, data = scipy.io.wavfile.read('Happy Tree Friends.wav')
>>> rate
8000
>>> data
array([ 5, -5, 5, ..., 0, -1, 0], dtype=int16)
>>> data_bis = np.fft.ifft(np.fft.fft(data))
>>> data_bis
array([ 5.00000000e+00 -1.55406753e-11j,
-5.00000000e+00 +1.95349676e-11j,
5.00000000e+00 +1.41131140e-11j, ...,
8.06674092e-12 -7.58643463e-13j,
-1.00000000e+00 -2.21611283e-12j, -2.04999489e-11 +4.55890751e-12j])
>>> data_bis.dtype
dtype('complex128')
虽然data
里的数值和data_bis
里的数值非常接近,但它们实际上是两种完全不同的东西,下面会展示这一点:
>>> scipy.io.wavfile.write('test.wav', rate, data_bis)
>>> scipy.io.wavfile.read('test.wav')
TypeError: data type not understood
不过,如果你把处理后的结果简单地转换回原来的dtype
,一切又会正常运作:
>>> scipy.io.wavfile.write('test.wav', rate, data_bis.astype(data.dtype))
__main__:1: ComplexWarning: Casting complex values to real discards the imaginary part
>>> scipy.io.wavfile.read('test.wav')
(8000, array([ 4, -5, 4, ..., 0, -1, 0], dtype=int16))