我使用IBM的Text-to-Speech API来运行扬声器检测。我使用pydub将几个.wav文件连接成一个,但是我不能将音频段传递给IBM。在
我的问题是:
我是否可以直接将我的文件导出到aws3存储桶中,以便以后从那里检索?
不然我怎么能通过音频部分?我可以把它作为一个变量进行不同的编码,这样就可以在不把它保存在内存中的情况下导出它吗?
这是IBM可以读取的格式
- 应用程序/八位字节流
- 音频/alaw(必需。指定音频的采样率(速率)
- 音频/基本(必需。仅用于窄带型号。)
- 音频/flac
- 音频/g729(仅用于窄带型号。)
- 音频/l16(必需。指定采样率(rate)以及可选的声道数(channels)和endianness(endianness))
- 音频/mp3
- 音频/mpeg
- 音频/音乐
- 音频/ogg
- 音频/ogg;编解码器=opus
- 音频/ogg;编解码器=vorbis
- 音频/wav
- 音频/webm
- 音频/webm;编解码器=opus
- 音频/webm;编解码器=vorbis
我喜欢pydub,到目前为止,它是一个很好的工具。谢谢你做的!在
Tags:
由于您无论如何都在使用python,所以可以使用smart_open将对象存储中的远程文件处理为区域设置文件。这将允许您将文件的各个部分流式传输到操作系统,而不必同时将它们全部存储在内存中。对于Objectstorage,任何格式都可以。在
相关问题 更多 >
编程相关推荐