数据代数是一种数据操作语言,既能生成SQL查询,又能对大熊猫数据文件进行工作。
data-algebra的Python项目详细描述
data_algebra是一个管道数据缠绕系统 基于Codd的关系代数和与DPLYR大规模合作的经验。初选 该软件包的目的是支持易于编写和维护的数据处理语法 这些步骤可用于生成特定于数据库的SQL。该包还实现 对pandas数据帧进行相同的转换。
这个包仍处于初始开发阶段,因此有些部分尚未实现或测试,而且api 随时可能改变。
成熟的、生产就绪的R版本的系统可用作 rquery和rqdatatable包。
推荐的软件包包括:pandas、pyyaml(supplies yaml)、sqlparse和black。