将结构化数据制表为可合并的csv格式
opentabulate的Python项目详细描述
打开表格
opentablate是一个python包,用于组织、制表和处理结构化数据。它目前的目标是成为Linkable Open Data Environment的数据处理框架,这是加拿大统计局特别业务项目中心(csbp)内的数据探索和集成实验室(deil)的一个探索性项目。opentablate优惠
- 自动数据检索
- 使用sources文件组织和检索数据的系统方法(灵感来自OpenAddresses),
- 将数据制成适合合并和链接的标准csv格式的表格,
- 处理数据的各种方法,包括地址解析、清理和重新格式化。
opentablate的api定义了几个类和方法,这样当组合成一个processing pipeline时。这将处理过程简化为类方法调用的序列。此外,这种设计可以方便地添加、修改和删除代码。
要求
数据处理软件的基本设置至少需要
可选依赖项
要使用full_addr
键处理源,需要一个地址解析器。下面是当前支持的地址分析器。
安装
请确保有一个可以访问Python Package Index的python包管理器。例如,如果有pip
,请运行
$ pip install opentabulate
安装包后,通过运行
$ opentab --initialize
它创建~/.opentabulate
和其他子目录。
文档
请看我们的GitHub wiki。
问题
您可以在Issues中发布问题、增强请求和错误。