darr是一个python科学库,用于以开放、简单和自解释的格式存储数字数据数组。
darr的Python项目详细描述
darr是一个python科学库,用于对 磁盘永久数字数据数组。还有其他的python库, 但darr也确保了工具的独立性和长期可访问性 数据。它保存并自动更新人类可读的解释 存储二进制数据,以及用于读取特定数据的代码 在当前各种科学数据工具中,如python、r、julia、idl, Matlab、Maple和Mathematica(参见[示例数组] (https://github.com/gbeckers/Darr/tree/master/examplearrays/examplearray_float64.darr)。
本质上,darr使您能够有效地与潜在的非常大的 python/numpy环境中的数据数组,并与 其他人不使用darr,甚至python,不导出任何内容。它 也是一种确保将来在 你可以用不同的工具。
darr目前支持数值n维阵列,并且在实验上 支持数值不规则数组,即一系列数组中 尺寸因长度而异。
DARR目前处于1.0之前,仍在进行重大开发。它是
开放源码,在New BSD License <https://opensource.org/licenses/BSD-3-Clause>
条款下免费提供。
DARR目前处于1.0之前,仍在进行重大开发。
功能
- 纯粹基于flat binary和text文件,工具独立。
- 支持超大数据数组到内存映射文件访问。
- 通过{STR 1 } $NUMPI索引< /强> 的数据读/写访问
- 数据很容易追加。
- 关于如何保存二进制数据的可读解释 在自述文件中。
- 自述文件还包含有关如何在流行的 分析环境,如python(不带darr)、r、julia, Octave/Matlab、GDL/IDL、Maple和Mathematica。
- 支持许多数值类型:(u)int8-(u)int64,float16-float64, 完成64,完成128。
- 易于使用元数据,存储在单独的json文本文件中。
- 最小依赖项,仅限numpy。
- 很容易与dask或numexpr库集成 在非常大的darr数组上进行数值计算。
有关详细信息,请参见documentation。