如何用Python从AWS S3的wav文件二进制流中提取前x秒音频？

-1 投票

0 回答

17 浏览

提问于 2025-04-12 00:28

我正在从S3读取一个10分钟的音频文件，但我想只取前x秒的音频数据作为字节流，然后进行一些语音分析（因为下游模型的API有限制，所以需要剪切音频）。

代码：

s3_bucket = 'llm-test-tmp'
key_prefix = "training-datasets/asr_notebook_data"
input_audio_file_name = 'audio.wav'

s3_client = boto3.client("s3")
s3_client.download_file(s3_bucket, f"{input_audio_file_name }", input_audio_file_name)

with open(input_audio_file_name, "rb") as file:
    wav_file_read = file.read()

我想把这个音频字节流剪切成前30秒、1分钟或者任意的前x秒。有没有简单的方法可以做到这一点，而不需要对数据类型做太多的改变或调整？

音频处理 aws s3 二进制流语音分析音频剪切数据流处理

0 个回答

暂无回答

如何用Python从AWS S3的wav文件二进制流中提取前x秒音频？

0 个回答

撰写回答