有人熟悉微软语音识别API吗?

-1 投票
1 回答
2016 浏览
提问于 2025-04-17 10:00

我正在用Python写一些语音识别的代码,我希望它能启动微软的语音识别系统,但我想让这个系统忽略所有普通的图形界面命令。也就是说,如果我说了什么被识别出来的内容,它会不理会这些内容,而是让我的程序来处理。

1 个回答

1

我相信有一个叫做 pyspeech 的Python接口,它是微软语音API的一个封装。你可以查看 pyspeech (python) - 转录mp3文件?,里面有一些可能对你有帮助的答案。

通常,当人们使用微软的语音API时,看到“常规的图形用户界面命令”意味着他们使用的是一个共享的识别器。你需要使用一个内部处理的识别器。你可以通过在你的应用程序中创建一个SpeechRecognitionEngine()来实现。具体可以参考 SpeechRecognitionEngine 类。我怀疑你正在使用一个共享的识别器 - SpeechRecognizer 类

几年前有一篇关于微软语音的非常好的文章,发布在 http://msdn.microsoft.com/en-us/magazine/cc163663.aspx。这是我找到的最好的入门文章,虽然有点过时,但还是很有帮助的。(AppendResultKeyValue 方法在测试版后被删除了。)

这两个问题可能也有一些其他有用的信息:

  1. System.Speech.Recognition 和 Microsoft.Speech.Recognition 有什么区别?
  2. SAPI 和 Windows 7 的问题

撰写回答