从流中使用 Google Cloud STT API 生成文字时间戳

2024-05-17 14:20:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我在Python项目中使用Google Cloud STT API。我有一个流,我想得到分词(或者文档中的单词时间戳)作为输出,但只有当结果是最终结果时(即演讲结束时,或者当演讲者暂停时),我才能得到它

有没有办法在演讲中取得结果?部分结果等

我已经读了所有的Google Docs,但是没有一个字说明这是否可能

我的配置如下所示:

stream_config = speech.types.StreamingRecognitionConfig(
            config=speech.types.RecognitionConfig(
                encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
                sample_rate_hertz=16000,
                language_code='en-US',
                enable_word_time_offsets=True,
                max_alternatives=1
            ),
            interim_results=True
        )

事实上,我只有在演讲结束后才能得到我想要的回应

我想在有人讲话的时候一直得到结果


Tags: 项目文档apiconfigtruecloudgoogle时间