将.wav从音频段导出到AWS S3 Bu

2024-04-29 02:49:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用IBM的Text-to-Speech API来运行扬声器检测。我使用pydub将几个.wav文件连接成一个,但是我不能将音频段传递给IBM。在

我的问题是:

  1. 我是否可以直接将我的文件导出到aws3存储桶中,以便以后从那里检索?

  2. 不然我怎么能通过音频部分?我可以把它作为一个变量进行不同的编码,这样就可以在不把它保存在内存中的情况下导出它吗?

这是IBM可以读取的格式

  • 应用程序/八位字节流
  • 音频/alaw(必需。指定音频的采样率(速率)
  • 音频/基本(必需。仅用于窄带型号。)
  • 音频/flac
  • 音频/g729(仅用于窄带型号。)
  • 音频/l16(必需。指定采样率(rate)以及可选的声道数(channels)和endianness(endianness))
  • 音频/mp3
  • 音频/mpeg
  • 音频/音乐
  • 音频/ogg
  • 音频/ogg;编解码器=opus
  • 音频/ogg;编解码器=vorbis
  • 音频/wav
  • 音频/webm
  • 音频/webm;编解码器=opus
  • 音频/webm;编解码器=vorbis

我喜欢pydub,到目前为止,它是一个很好的工具。谢谢你做的!在


Tags: 文件totext编解码器音频vorbisibm型号
1条回答
网友
1楼 · 发布于 2024-04-29 02:49:49

由于您无论如何都在使用python,所以可以使用smart_open将对象存储中的远程文件处理为区域设置文件。这将允许您将文件的各个部分流式传输到操作系统,而不必同时将它们全部存储在内存中。对于Objectstorage,任何格式都可以。在

相关问题 更多 >