有人熟悉微软语音识别API吗？

-1 投票

1 回答

2016 浏览

数据工程师

提问于 2025-04-17 10:00

我正在用Python写一些语音识别的代码，我希望它能启动微软的语音识别系统，但我想让这个系统忽略所有普通的图形界面命令。也就是说，如果我说了什么被识别出来的内容，它会不理会这些内容，而是让我的程序来处理。

自然语言处理语音识别语音交互微软API

1 个回答

我相信有一个叫做 pyspeech 的Python接口，它是微软语音API的一个封装。你可以查看 pyspeech (python) - 转录mp3文件？，里面有一些可能对你有帮助的答案。

通常，当人们使用微软的语音API时，看到“常规的图形用户界面命令”意味着他们使用的是一个共享的识别器。你需要使用一个内部处理的识别器。你可以通过在你的应用程序中创建一个SpeechRecognitionEngine()来实现。具体可以参考 SpeechRecognitionEngine 类。我怀疑你正在使用一个共享的识别器 - SpeechRecognizer 类。

几年前有一篇关于微软语音的非常好的文章，发布在 http://msdn.microsoft.com/en-us/magazine/cc163663.aspx。这是我找到的最好的入门文章，虽然有点过时，但还是很有帮助的。（AppendResultKeyValue 方法在测试版后被删除了。）

这两个问题可能也有一些其他有用的信息：

回答于 2025-04-17 由 Python大师

分享举报

有人熟悉微软语音识别API吗？

1 个回答

撰写回答