python语音识别将说话人添加到结果中

2024-04-20 07:35:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用python语音识别模块将音频文件转录成文本。然而,在我使用的文本文件中,有两种声音在说话。我想知道我是否可以将输出分成两个不同的扬声器

如果这有点模棱两可,我会重新解释。音频文件包含两个正在进行对话的人。我希望python程序将音频文件转录成文本,包括两个扬声器。例如,输出应如下所示:

演讲者1:你好,我叫乔希 演讲者2:很高兴认识你,我叫艾登 等等

到目前为止,我的程序能够正确地将音频文件转录成纯文本


Tags: 模块文本程序声音语音对话音频文件演讲者