pyspeech (python) - 如何转录mp3文件?

6 投票
2 回答
7260 浏览
提问于 2025-04-16 09:29

我想用pyspeech这个API把mp3文件里的语音转成文字,但我不知道这样做行不行。

可以吗?怎么做?

2 个回答

2

我对pyspeech不太了解,但如果它是一个用来调用微软语音API的Python工具,那么其他一些帖子可能会对你有帮助。

微软的语音引擎不需要麦克风输入,它们可以直接接受音频文件。

如果你想进行转录(把语音变成文字),你需要一个专门的语音识别规则。微软在Windows 7和Vista的客户端版本中提供了这些语音识别规则,但在微软的服务器版本中是没有的。

在C#中使用语音识别规则的一个简单例子,可以参考StackOverflow上的这个问题:SAPI和Windows 7问题

2

pyspeech看起来只是一个用Python编写的接口,用来和Windows的语音API进行沟通。很可能你需要想办法把mp3播放当作这个语音API可以听到的音频来源。

撰写回答