如何用Python从AWS S3的wav文件二进制流中提取前x秒音频?

-1 投票
0 回答
17 浏览
提问于 2025-04-12 00:28

我正在从S3读取一个10分钟的音频文件,但我想只取前x秒的音频数据作为字节流,然后进行一些语音分析(因为下游模型的API有限制,所以需要剪切音频)。

代码:

s3_bucket = 'llm-test-tmp'
key_prefix = "training-datasets/asr_notebook_data"
input_audio_file_name = 'audio.wav'

s3_client = boto3.client("s3")
s3_client.download_file(s3_bucket, f"{input_audio_file_name }", input_audio_file_name)

with open(input_audio_file_name, "rb") as file:
    wav_file_read = file.read()

我想把这个音频字节流剪切成前30秒、1分钟或者任意的前x秒。有没有简单的方法可以做到这一点,而不需要对数据类型做太多的改变或调整?

0 个回答

暂无回答

撰写回答