Python的窗口变桨

import librosa import librosa.display import numpy as np import matplotlib.pyplot as plt import IPython.display as ipd import random samples, sr = librosa.load('my_raw_vocals.wav',sr=None) def manipulate(data, sampling_rate, pitch_factor): return librosa.effects.pitch_shift(data, sampling_rate, pitch_factor) def block(array, size): c = [] array = list(array) for i in range(0,len(array) // size): frames = array[i*size:i*size+size] np_frames = np.asarray(frames) c.append(np_frames) perc_remainder = (len(array) / size) - (len(array) // size) if perc_remainder != 0: n_remainder = perc_remainder * size remainders = np.asarray(array[-1 * int(n_remainder):]) c.append(remainders) return c block512 = block(samples,512) summation = [] rate = 2 for i in block512: altered_frame = manipulate(i,sr,r) summation.append(altered_frame) frame_pitched512 = np.ndarray.flatten(np.asarray(summation)) frame_pitched512 = [val for sublist in summation for val in sublist] frame_pitched512 = np.asarray(frame_pitched512) ipd.Audio(frame_pitched512, rate=sr)

1条回答

网友

1楼 · 发布于 2024-04-23 14:26:33

关于整个代码，我应该注意到一些事情：

1-在声音处理方面，汉明窗是更好的选择，而矩形窗无疑是最差的

2-为了得到一个可接受的答案，应该有一个规范化array/max(abs(array))

3-你应该对演讲应用预强调（仅用于演讲）

4-另一件重要的事情是使用稳健的基音检测，可以通过以下多种方式实现：

奇怪的是，每帧的音高变化超过30%，所以这些太大或太大的音高实际上是实际音高的2倍或0.5倍。因此，您应该应用音高跟踪，以确保获得真实的结果

相关问题更多 >

编程相关推荐

热门问题

热门文章