如何将Azure数据工厂复制活动的输出存储为json而非octet-stream

0 投票

1 回答

53 浏览

提问于 2025-04-14 15:38

我现在正在使用Azure数据工厂（ADF），把一个文件存储到数据湖里，供一个Python脚本（以Azure函数的形式）使用。不过，Python脚本没有正确读取到这个文件，因为ADF把json文件保存成了八位字节流（octet-stream）。请问有没有什么设置可以让ADF正确保存这个文件，或者有没有好的方法让我在Python中读取八位字节流文件？

非常感谢任何帮助。

1 个回答

当你从Azure数据工厂的复制活动中复制文件时，默认情况下它会被复制为内容类型octet-stream。

作为一种解决方法，你可以通过使用Web活动来设置blob的属性，方法是调用blob API来设置属性。这个操作应该在复制活动完成后执行。

URL - https://yourstorageaccountname.blob.core.windows.net/containername/directory/file.json?<Sas token wil all permission>
Method - Put
Body - {}
Headers:
x-ms-blob-content-type - application/json
x-ms-version - 2020-04-08
x-ms-blob-type - BlockBlob

enter image description here

输出结果：

enter image description here

回答于 2025-04-14 由 Python大师

分享举报

如何将Azure数据工厂复制活动的输出存储为json而非octet-stream

1 个回答

撰写回答