pyspeech (python) - 如何转录mp3文件?
我想用pyspeech这个API把mp3文件里的语音转成文字,但我不知道这样做行不行。
可以吗?怎么做?
2 个回答
2
我对pyspeech不太了解,但如果它是一个用来调用微软语音API的Python工具,那么其他一些帖子可能会对你有帮助。
微软的语音引擎不需要麦克风输入,它们可以直接接受音频文件。
如果你想进行转录(把语音变成文字),你需要一个专门的语音识别规则。微软在Windows 7和Vista的客户端版本中提供了这些语音识别规则,但在微软的服务器版本中是没有的。
在C#中使用语音识别规则的一个简单例子,可以参考StackOverflow上的这个问题:SAPI和Windows 7问题
2
pyspeech看起来只是一个用Python编写的接口,用来和Windows的语音API进行沟通。很可能你需要想办法把mp3播放当作这个语音API可以听到的音频来源。