pyspeech (python) - 如何转录mp3文件？

6 投票

2 回答

7260 浏览

提问于 2025-04-16 09:29

我想用pyspeech这个API把mp3文件里的语音转成文字，但我不知道这样做行不行。

可以吗？怎么做？

api使用语音识别 mp3处理音频转录

2 个回答

我对pyspeech不太了解，但如果它是一个用来调用微软语音API的Python工具，那么其他一些帖子可能会对你有帮助。

微软的语音引擎不需要麦克风输入，它们可以直接接受音频文件。

如果你想进行转录（把语音变成文字），你需要一个专门的语音识别规则。微软在Windows 7和Vista的客户端版本中提供了这些语音识别规则，但在微软的服务器版本中是没有的。

在C#中使用语音识别规则的一个简单例子，可以参考StackOverflow上的这个问题：SAPI和Windows 7问题

回答于 2025-04-16 由 Python大师

分享举报

pyspeech看起来只是一个用Python编写的接口，用来和Windows的语音API进行沟通。很可能你需要想办法把mp3播放当作这个语音API可以听到的音频来源。

回答于 2025-04-16 由 Python大师

分享举报