将mitgcm mds二进制文件读入xarray
xmitgcm的Python项目详细描述
xmitgcm是一个python包,用于将MITgcm二进制mds文件读入 xarray数据结构。通过将数据存储在dask数组中,xmitgcm启用 mitgcm输出数据的并行out-of-core分析。
链接
安装
要求
xmitgcm与python 3和python 2.7兼容。它需要xarray (>;=版本0.8.2)和dask(>;=版本0.11.2)。 这些软件包通过 conda环境管理 系统,它是Anacondapython发行版的一部分。假设你有 Conda在您的系统上可用,依赖项可以与 命令:
conda install xarray dask
如果您使用的是这些包的早期版本,则应在 安装xmitgcm。
从github安装
xmitgcm正在积极开发中。为了获得最新的开发版本, 你可以克隆source repository 然后安装:
git clone https://github.com/xgcm/xmitgcm.git cd xmitgcm python setup.py install
鼓励用户fork xmitgcm并提交issues和pull requests。
快速启动
首先确保您了解xarray数据集对象是什么。然后找到 一些mitgcm mds数据。如果你没有自己的数据,你可以下载 xmitgcm test repositories 要下载一些测试数据,请运行shell命令:
$ curl -L -J -O https://ndownloader.figshare.com/files/6494718 $ tar -xvzf global_oce_latlon.tar.gz
这将创建一个名为global_oce_latlon的目录,我们将使用它 其他的例子。如果您有自己的数据,请将其替换为 mitgcm文件的路径。
要将mitgcm mds数据作为xarray.dataset操作,请在python中执行以下操作:
from xmitgcm import open_mdsdataset data_dir = './global_oce_latlon' ds = open_mdsdataset(data_dir)
data_dir,应该是 mitgcm运行目录。xmitgcm将自动扫描此目录并 尝试确定要读取的文件前缀和迭代号。在一些 配置中,open_mdsdataset函数可能不需要进一步 关键字参数。在大多数情况下,您必须指定进一步的详细信息。
查阅online documentation了解 更多细节。