如何使用Python识别和匹配2个或更多短音频文件的音频段中的模式?

2024-03-29 05:21:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个原型,在那里我试图找到并匹配两个音频文件之间的模式。作为一个简单的例子,假设我们有两个5秒的音频文件,其中包含我的录音,如下所示: 1.“我喜欢狗。” 2.“狗太棒了!”

在这里,我想分析和识别某些特征,这样我就可以得出结论,两个音频文件之间的常用词是单词“Dog”。请注意,内容并不重要。否则我就可以把它转换成文本并匹配。我想分析常见的特征模式。我对mfcc、色度图等音频功能有基本的了解,但在这种情况下使用什么以及如何使用


Tags: 文本功能内容模式特征音频单词原型