如何用Python从AWS S3的wav文件二进制流中提取前x秒音频?
我正在从S3读取一个10分钟的音频文件,但我想只取前x秒的音频数据作为字节流,然后进行一些语音分析(因为下游模型的API有限制,所以需要剪切音频)。
代码:
s3_bucket = 'llm-test-tmp'
key_prefix = "training-datasets/asr_notebook_data"
input_audio_file_name = 'audio.wav'
s3_client = boto3.client("s3")
s3_client.download_file(s3_bucket, f"{input_audio_file_name }", input_audio_file_name)
with open(input_audio_file_name, "rb") as file:
wav_file_read = file.read()
我想把这个音频字节流剪切成前30秒、1分钟或者任意的前x秒。有没有简单的方法可以做到这一点,而不需要对数据类型做太多的改变或调整?
0 个回答
暂无回答