在文本文件中交叉制表数据。
xtab的Python项目详细描述
xtab.py是一个python模块和命令行程序 将数据从规范化格式重新排列为交叉表格式。它需要数据 以这种形式:
Station | Date | Value |
WQ-01 | 2006-05-23 | 4.5 |
WQ-02 | 2006-05-23 | 3.7 |
WQ-03 | 2006-05-23 | 6.8 |
WQ-01 | 2006-06-15 | 9.7 |
WQ-02 | 2006-05-15 | 5.1 |
WQ-03 | 2006-06-15 | 7.2 |
WQ-01 | 2006-07-19 | 10 |
WQ-02 | 2006-07-19 | 6.1 |
WQ-03 | 2006-07-19 | 8.8 |
并将其重新排列为以下形式:
Station | 2006-05-23 | 2006-06-15 | 2006-07-19 |
WQ-01 | 4.5 | 3.7 | 6.8 |
WQ-02 | 9.7 | 5.1 | 7.2 |
WQ-03 | 10 | 6.1 | 8.8 |
输入和输出都是文本(csv)文件。
它的功能和用途摘要如下所示。完整文件 可在http://xtab.readthedocs.org/找到。
能力
您可以使用xtab程序:
- 重新排列从数据库导出的数据以更好地适应 在统计、建模、图形或其他方面的后续使用 软件,或为更容易的视觉审查和表格准备。
- 将单个数据文件(表)转换为sqlite数据库。
- 检查同一文本文件中的多行数据 关键价值观。
注释
- 多个数据值可以交叉制表,在这种情况下,输出 将包含多组相似的列。
- 输出文件中可以生成一行或两行标题。 一行是默认值,最适合输出文件将 由其他软件进一步处理。两行便于阅读 当输出包含多组相似列时。
- xtab程序不执行任何摘要或 计算数据值,因此 在输出的每个单元格中最多放置一个数据值 桌子。每个单元格有多个值被视为错误,并且 在这种情况下,单元格中只会放入多个值中的一个。
- 可以将错误消息记录到控制台或文件中。如果没有 指定了错误日志记录选项,则如果有多个值 要放入单元格(最可能的数据错误),一条消息 将打印在控制台上,指示 发生了这种情况。如果指定了错误日志记录选项, 然后,对于存在多个值的所有个别情况,使用sql 将记录每个单元格。
- 用于从每个 输出表单元格可以记录到文件中。
- 作为交叉插入过程的中间步骤,数据被转换 到sqlite表。默认情况下,此表是在内存中创建的。 但是,可以选择在磁盘上创建并保留它,以便 在交叉制表完成后可用。
- 中的行或列数没有固有限制。 输入或输出文件。(因此,输出可能超过 其他软件。)
- 输入和输出文件名,以及输入文件中的列名 用于行标题、列标题和单元格值 所有这些都需要作为命令行参数。如果任何必需的参数是 丢失,将引发异常,无论错误日志记录选项是什么。
- 数据行按行标题和列按字母顺序排列 标题在输出中按字母数字排序。