谷歌语音到文本API不适用于超过一分钟的音频文件

service_request = service.speech().asyncrecognize( body={ 'config': { 'encoding': 'LINEAR16', # raw 16-bit signed LE samples 'sampleRate': 16000, # 16 khz 'languageCode': 'en-US', # a BCP-47 language tag }, 'audio': { 'uri':'gs://xxxxxxxxx/english.raw' } }) response = service_request.execute() print(json.dumps(response))

2条回答

网友

1楼 · 编辑于 2024-04-28 12:09:47

我对这个问题的发现如下

1）Google语音到文本API是为识别短音频文件而构建的。 2）它在给定时间内处理的“音频数据”的数量是有限的。推得太多，谷歌就会忽略它 3）如果你真的想进入这一领域，你就必须弄清楚如何预处理你的音频文件，并将音频文件“分割”成可消费的块。在

网友

2楼 · 编辑于 2024-04-28 12:09:47

很难从代码中判断出来，但必须提交一个同步请求。根据docs，长度限制在~60秒。异步请求最多可接受80分钟。通读APIs and Reference文档，了解如何正确地为所使用的API构造请求。在

相关问题更多 >

编程相关推荐

热门问题

热门文章