如何将Azure数据工厂复制活动的输出存储为json而非octet-stream
我现在正在使用Azure数据工厂(ADF),把一个文件存储到数据湖里,供一个Python脚本(以Azure函数的形式)使用。不过,Python脚本没有正确读取到这个文件,因为ADF把json文件保存成了八位字节流(octet-stream)。请问有没有什么设置可以让ADF正确保存这个文件,或者有没有好的方法让我在Python中读取八位字节流文件?
非常感谢任何帮助。
1 个回答
1
当你从Azure数据工厂的复制活动中复制文件时,默认情况下它会被复制为内容类型octet-stream。
作为一种解决方法,你可以通过使用Web活动来设置blob的属性,方法是调用blob API来设置属性。这个操作应该在复制活动完成后执行。
URL - https://yourstorageaccountname.blob.core.windows.net/containername/directory/file.json?<Sas token wil all permission>
Method - Put
Body - {}
Headers:
x-ms-blob-content-type - application/json
x-ms-version - 2020-04-08
x-ms-blob-type - BlockBlob
输出结果: