使用可插入训练的nlp模型将语音转换为长格式工作流的包
vocalist的Python项目详细描述
歌手
这是一个仍处于早期开发阶段的简单项目,旨在将语音解析为文本。在当前状态下,它只在Mac上工作,并且只在安装了PortAudio兼容版本的Mac上工作。
它是按照这里的教程构建的:https://realpython.com/python-speech-recognition/
设置
使用自制程序,安装portaudio:
$ brew install portaudio
从那里您可以像平常一样安装依赖项:
$ pip install -r requirements.txt
用法
如果要直接调用它,请按原样运行包:
$ python ./main.py
它当前未部署用于包管理。