zarr不考虑来自xarray的块大小并恢复到原始块大小

1条回答

网友

1楼 · 发布于 2024-05-15 21:34:37

这似乎是一个已知的issue，并且在该问题的线程和recently merged PR中正在进行相当多的讨论

基本上，数据集在.encoding属性中携带原始分块。因此，当您调用第二个写入操作时，在ds[var].encoding['chunks']（如果存在）中定义的块将用于将var写入zarr

根据GH问题中的对话，目前最好的解决方案是手动删除相关变量的区块编码：

for var in ds:
    del ds[var].encoding['chunks']

然而，应该注意的是，这似乎是一种不断演变的情况，最好检查进展情况，以适应最终解决方案

下面是一个小示例，展示了问题和解决方案：

import xarray as xr

# load data and write to initial chunking 
x = xr.tutorial.load_dataset("air_temperature")
x.chunk({"time":500, "lat":-1, "lon":-1}).to_zarr("zarr1.zarr")

# display initial chunking
xr.open_zarr("zarr1.zarr/").air

# rechunk
y = xr.open_zarr("zarr1.zarr/").chunk({"time": -1})

# display
y.air

#write w/o modifying .encoding
y.to_zarr("zarr2.zarr")

# display
xr.open_zarr("zarr2.zarr/").air

# delete encoding and store
del y.air.encoding['chunks']
y.to_zarr("zarr3.zarr")

# display
xr.open_zarr("zarr3.zarr/").air

相关问题更多 >

编程相关推荐

热门问题

热门文章

zarr不考虑来自xarray的块大小并恢复到原始块大小

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >