用于加载、分析和切片采集数据的包
channelpack的Python项目详细描述
一个基于 条件。通道的条件和命名可以保存为配置文件和 稍后以方便的方式重用。
channelpack源于测试工程处理数据文件的经验 测试测量。如果这些文件是文本文件,它们可能有一些 在加载到python之前不需要知道特性:
- 要跳过的行-测试数据之前的许多行(文件元数据)。
- 数据分隔符-用于分隔一个数据和另一个数据的字符,通常 空格、制表符或逗号。
- 小数点分隔符-根据您所在的区域,小数点分隔符是 有时是逗号,有时是点。
- “channels”的命名,如果命名的话,可以在不在正上方的行上 数据(例如,以下行可以是工程单位)。
channelpack打算处理所描述的文本数据文件的不便之处 上面。
数据文件:
- 任何文本(数字)类型的文件(使用numpy的loadtxt)。
- dbf文件(raymond hettingerrecipe作为低级读取器)。
- 电子表格文件(使用xlrd)。
- 任何由您自己的工具读取的文件,提供一个返回dict的函数 与channelpack类的通道连接。
示例
channelpack有一些获取包的便利功能:
>>> import channelpack as cp >>> sp = cp.sheetpack('testdata/sampledat3.xls') >>> sp.chnames {0: u'txtdata', 1: u'nums', 2: u'floats'}
通过名称或列索引,可以调用包:
>>> sp(0) array([u'A', u'A', u'C', u'D', u'D'], dtype='<U1') >>> sp(0) is sp('txtdata') True
保持布尔掩码数组以跟踪“真实部分”:
>>> sp.parts() [0] >>> sp.add_condition('cond', '(%(0) == "A") | (%(0) == "D")') >>> sp.parts() [0, 1] >>> sp('txtdata', 0) array([u'A', u'A'], dtype='<U1') >>> sp('txtdata', 1) array([u'D', u'D'], dtype='<U1')
现在保持这些条件并加载需要相同条件的新数据集 条件:
>>> sp.spit_config() >>> sp = cp.sheetpack('testdata/sampledat4.xls', stopcell='c6') >>> sp('txtdata') array([u'A', u'C', u'C', u'C', u'D'], dtype='<U1') >>> sp.parts() [0] >>> sp.eat_config() >>> sp.parts() [0, 1] >>> sp('txtdata', 0) array([u'A'], dtype='<U1') >>> sp('txtdata', 1) array([u'D'], dtype='<U1')
取决于
从0.2.0版起,存在对XLRD的依赖关系。如果没有安装 可用。
channelpack导入numpy。安装channelpack不会安排 要安装的numpy。按你的方式做。如果你考虑 channelpack,你已经安装了numpy。