音频段对象与wave文件/d之间的转换问题的回答

音频段对象与wave文件/d之间的转换

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我正在从mp3语音文件提取MFCC功能，但我确实想保持源文件不变，不添加任何新文件。我的处理包括以下步骤： <ul> <li>加载.mp3文件，消除静默，并使用<code>pydub</code>生成.wav数据</li> <li>使用<code>scipy.io.wavfile.read()</code>读取音频数据和速率</li> <li>使用<code>python_speech_features</code>提取特征</li> </ul> 但是，<code>eliminate_silence()</code>返回一个<code>AudioSegment</code>对象，而<code>scipy.io.wavfile.read()</code>接受一个<code>.wav</code>文件名，因此我被迫临时将数据保存/导出为wave，以确保两者之间的转换。这个步骤需要内存和时间，所以我的问题是：如何避免导出wave文件步骤？或者有解决办法吗？在 这是我的密码。在 <pre><code>import os from pydub import AudioSegment from scipy.io.wavfile import read from sklearn import preprocessing from python_speech_features import mfcc from pydub.silence import split_on_silence def eliminate_silence(input_path): """ Eliminate silent chunks from original call recording """ # Import input wave file sound = AudioSegment.from_mp3(input_path) chunks = split_on_silence(sound, # split on silences longer than 1000ms (1 sec) min_silence_len=500, # anything under -16 dBFS is considered silence silence_thresh=-30, # keep 200 ms of leading/trailing silence keep_silence=100) output_chunks = AudioSegment.empty() for chunk in chunks: output_chunks += chunk return output_chunks silence_clear_data = eliminate_silence("file.mp3") silence_clear_data.export("temp.wav", format="wav") rate, audio = read("temp.wav") os.remove("temp.wav") # Extract MFCCs mfcc_feature = mfcc(audio, rate, winlen = 0.025, winstep = 0.01, numcep = 15, nfilt = 35, nfft = 512, <a href="https://www.cnpython.com/list/append" class="inner-link">append</a>Energy = True) mfcc_feature = preprocessing.scale(mfcc_feature) </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

音频段对象与wave文件/d之间的转换

1 个回答

相关Python问题