我已经把这段代码编好了,可以把音频转换成文本。它不是转换整个文本。音频的总持续时间为1.21分钟。但是这个程序只从音频输出4个单词,其余的对话都丢失了。有人能帮我解决这个问题吗。下面是代码
import speech_recognition as sr
from gtts import gTTS
import os
import playsound
r = sr.Recognizer()
with sr.AudioFile('Track1.wav') as source:
r.adjust_for_ambient_noise(source, duration=0.5)
audio = r.listen(source)
try:
text = (r.recognize_google(audio, language="en-US"))
print('working on...')
print(text)
except:
print('Sorry.. run again..')
尝试其他音频文件。如果其他音频文件也只有几个单词,则可能是语音识别库中recognize\u Google函数使用的“free”默认Google API键的限制。在这种情况下,您将需要自己的API密钥来转录更长的音频文件
相关问题 更多 >
编程相关推荐