如何将Azure数据工厂复制活动的输出存储为json而非octet-stream

0 投票
1 回答
53 浏览
提问于 2025-04-14 15:38

我现在正在使用Azure数据工厂(ADF),把一个文件存储到数据湖里,供一个Python脚本(以Azure函数的形式)使用。不过,Python脚本没有正确读取到这个文件,因为ADF把json文件保存成了八位字节流(octet-stream)。请问有没有什么设置可以让ADF正确保存这个文件,或者有没有好的方法让我在Python中读取八位字节流文件?

非常感谢任何帮助。

1 个回答

1

当你从Azure数据工厂的复制活动中复制文件时,默认情况下它会被复制为内容类型octet-stream。

作为一种解决方法,你可以通过使用Web活动来设置blob的属性,方法是调用blob API来设置属性。这个操作应该在复制活动完成后执行。

URL - https://yourstorageaccountname.blob.core.windows.net/containername/directory/file.json?<Sas token wil all permission>
Method - Put
Body - {}
Headers:
x-ms-blob-content-type - application/json
x-ms-version - 2020-04-08
x-ms-blob-type - BlockBlob

enter image description here

输出结果:

enter image description here

撰写回答