我使用parselmouth(praat包装器)来提取强度和音高特征,方法是:
snd = parselmouth.Sound(path)
intensity = snd.to_intensity()
pitch = snd.to_pitch()
但是,音频文件包含长序列的静音,我想在计算这些音频指标之前删除这些静音。我可以通过处理通过wave包读取音频(并应用一些逻辑)返回的numpy数组来消除静默,但无法将新数组传递给parselmouth。在
我甚至愿意为parselmouth提供startTime和endTime参数,但也找不到支持这两个参数的文档。在
有两个选项可能对这种情况有用:
parselmouth.Sound
,而不是从文件中读取。有a constructor taking a NumPy array (or a list/iterable convertible to NumpyArray) and sampling frequency如果你不想在窗口上留下一个不连续的音高,那么你就不想在窗口上留下一个不连续的音高和音高,如果你不想这样做的话,你会用一个不连续的音高和音高分析来保持一定的音高和音高如果你不留一个空白,在那里检测到沉默/没有发声,相邻片段的音高估计会相互影响)。在
相关问题 更多 >
编程相关推荐