木槿光谱图对数形态

2024-06-06 15:19:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用python中的Librosa从GTZAN数据集中提取一个log-Mel-spectrogram。我的代码-

data, sampling_rate = librosa.load(os.path.join(dir, folder, file), )
mel = librosa.feature.melspectrogram(y=data, hop_length = 512//2, n_fft = 512, n_mels = 64)
mel = librosa.power_to_db(mel**2)

嗯,它工作得很好。但是,每个Mel谱图的大小是不同的。大多数对数Mel谱图的大小为2586,少数为2590~2620。在

我检查了在Mel谱图上记录的尺寸是否不同。当录音时,他们的大小有多大不同,因为所有的音频都在同一长度。。。在

有什么建议吗,谢谢


Tags: 数据path代码logdatarateosload
1条回答
网友
1楼 · 发布于 2024-06-06 15:19:20

可能音频文件的长度略有不同。这通常发生在数据集中。你可能应该把所有的光谱图截短到最短的公共长度(2586)。在

mel = mel[:,0:2586]

相关问题 更多 >