python中的n-d标记数组和数据集
xarra的Python项目详细描述
xarray(以前的xray)是一个开源项目和python包 这使得使用标签多维数组变得简单, 高效,有趣!
xarray以尺寸、坐标和 原始NumPy类数组上的属性,它允许 直观,更简洁,不易出错的开发经验。 这个包包括一个庞大的、不断增长的领域不可知函数库。 使用这些数据结构进行高级分析和可视化。
xarray受到了流行数据pandas的启发,并大量借鉴了这些数据 分析包的重点是标签表格数据。 它特别适合处理netCDF文件,这些文件是 xarray数据模型的源,并与dask紧密集成以实现并行 计算。
为什么是夏雷?
多维数组(有时称为 “张量”)是计算科学的重要组成部分。 他们在很多领域都遇到过,包括物理学,天文学, 地球科学、生物信息学、工程、金融和深度学习。 在python中,NumPy为 使用原始nd数组。 然而,现实世界中的数据集通常不仅仅是原始数据; 它们有编码数组值映射信息的标签 到空间、时间等位置。
xarray不仅仅跟踪数组上的标签,它还使用它们来提供 强大简洁的界面。例如:
- 按名称对维度应用操作:x.sum('time')。
- 按标签而不是整数位置选择值: x.loc['2014-01-01']或x.sel(time='2014-01-01')。
- 数学运算(例如x - y)对多个 维度(数组广播)基于维度名称,而不是形状。 LI>灵活拆分应用组合操作与分组: x.groupby('time.dayofyear').mean()。
- 基于平滑的坐标标签的类似数据库的对齐 处理缺少的值:x, y = xr.align(x, y, join='outer')。
- 以python字典的形式跟踪任意元数据: x.attrs。