我正在做和应用程序做休耕:
1:
如果麦克风检测到一些噪声,它将开始录制音频,直到没有检测到噪声为止。之后,音频被记录到wav文件中。
2:
我必须在上面检测一些单词。只有,5到10个单词可以检测。
到目前为止,我的代码只做第一部分(检测噪音和录音)。现在,我有一个包含以下单词的列表:help, please, yes, no, could, you, after, tomorrow
。我需要一个离线的方法来检测我的声音是否包含这些单词。这可能吗?我该怎么做?我正在使用linux,没有办法将操作系统更改为windows或使用虚拟机。
我正在考虑使用声音的频谱图,创建一个训练数据库,并使用一些分类器来预测。例如,this是一个单词的谱图。这是个好的技巧吗?
谢谢。
您可以使用python中的pocketspinx,使用
pip install pocketsphinx
安装。代码如下:关键字列表应如下所示:
数字是检测的阈值
相关问题 更多 >
编程相关推荐