结构化、元数据增强的数据存储。

dsch的Python项目详细描述


DSCH

简介

dsch提供了一种将数据及其元数据存储在结构化、可靠的 方式。它建立在众所周知的数据存储引擎之上,例如 hdf5 文件 格式,提供性能和长期稳定性。

核心特性是基于模式的数据存储方法,这意味着 预定义的模式规范用于确定:

  • 哪些数据字段可用
  • 数据字段的(分层)结构
  • 存储值的元数据(例如物理单位)
  • 存储值的预期数据类型和约束

实际上,这类似于api规范,但是它可以附加到 与数据一起存储。程序编写数据集得益于数据验证 以及高级接口。 读取 程序可以确定给定数据的 预先计划,并进行相应的处理。这对于模式特别有用 随着时间的推移而发展。

对于持久存储,dsch通过其 后端 ,但全部通过一个透明的接口。通常,有 无需更改客户端代码即可支持新后端和自定义后端 可以很容易地添加到DSCH。 目前,这些存储引擎存在后端:

请注意,dsch只是一个很薄的层,因此用户仍然可以从 底层存储引擎的性能。另外,使用dsch创建的文件可以 始终直接打开(即没有DSCH),并且仍然提供所有相关的 信息,甚至元数据!

推理

DSCH是对低级数据采集场景中挑战的响应, 通常在大学或研发部门的实验室中发现。频繁 在这些环境中,硬件和软件的更改是司空见惯的,而且 由于这些变化通常是由不同的人进行的,所以数据采集 硬件、软件和数据消费软件往往不同步。在 同时,数据集经常被存储(和使用!)多年来,这使得 向后兼容性是一个重要问题。

dsch的目标是通过使数据交换过程 明确的。使用预定义的模式可以确保向后兼容,只要 可能的,并且当它不能再被保留时,提供了一种清晰的方法来检测 (并正确处理)多个架构版本。另外,基于模式的验证 允许预先检测可能的错误,以便大多数与安全无关的 在使用数据的应用程序中,不必重新执行检查。

请注意,dsch主要针对这些低级应用程序。使用时 高级数据处理甚至数据科学和机器学习技术, 数据通常是针对特定的 应用程序,它通常不需要dsch的某些功能,例如 作为元数据存储。人们可能认为dsch是处理数据的工具。 之前,它被填充成类似于熊猫的内容。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Room SQLite如何创建SELECT返回1对象?   java将多个XML元素添加到同一个类中   具有固定数量子项的java CardView   用于在聊天应用程序中加载消息的java JavaFx ListView   java Firebase实时数据库和身份验证库版本不兼容   java修复HashMap中的ClassCastException   java自定义侦听器/接口在Android中不起作用   java如何只更改TextView的背景alpha而不是整个视图?   switch语句Java逻辑错误第十位小数未显示   java如何将ListAdapter中创建的视图添加到数组   我的应用程序中的java ANR问题   在Java中完全打开枚举会产生“缺少返回语句”错误   java如果链表中存储的对象不可克隆,如何创建链表的深度副本?   java Android:将网站表读入表/列表视图