管理大型数据集的工具

expressionable的Python项目详细描述


#expressionable python模块
expressionable python模块的官方存储库,它允许:
*将表格数据集从一种格式转换为另一种格式。
*查询大数据集以筛选有用的数据。
*选择要包含在结果数据集中的其他列/功能。
*将各种格式的数据集合并到单个文件中。
*g将结果数据集打包,以及读取gzip文件的能力。



基本用途如下所述,但请参阅[阅读文档]上的完整文档(https://shapeshifter.read the docs.io/en/latest/)。
expressionable对象
表示要转换的文件。然后使用“export-filter-results”方法对其进行转换。下面是一个名为“input_file.tsv”的文件被转换为名为“output_file.h5”的hdf5文件的简单例子,在过滤
有关性别和年龄的数据时:
``python
来自expressionable import expressionable

my_expressionable=expressionable(“input_file.tsv”)
my_expressionable.export_filter_results(“output_file.h5”,filters=“sex='m'and age>;40”)
```
请注意,读取和导出到的文件类型没有说明根据提供的文件扩展名由expressionable显式推断。如有必要,“input_file_type”和“output_file_type”可以显式命名。



\contribution
我们欢迎有助于扩展表达式以兼容其他文件格式的贡献。如果您对贡献感兴趣,请按照[这里](https://github.com/srp33/expressionable/wiki/adding-support/adding-support/expressionable中的其他文件类型)的说明[这里](https://github.com/srp33/expressionable/wiki/wiki/adding-support/expressionable中的其他文件类型)按照[这里](https://http://github.com/www.目前支持的格式输入格式:
*csv
*tsv
*tsv
*json
*excel
*excel
*hdf5
*parquet
*msgpack
*stata
*stata
*picklpickl
*arff
*gct
*gctx
*pdf
*kallisto
*geo
*starreads





<<<<<<<<
*csv
*tsv
*json
*excel
*hdf5
*parket
*msgpack
*stata
*picket
*sqlite
*arff
*arff
*gct
*rmarma
*rma
*geo
*geo
*星
*星
*星
*星
*星

*gct
*rma*jupyternotebook

expressionable可以处理更多的文件格式!预计未来版本中将包含以下格式:
*固定宽度文件(fwf)
*基因组数据共享临床xml



欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
来自Java库的文件上载更改提示错误消息   java如何使用Hibernate自动释放游标?   java Eclipse远程开发,有哪些选项?   在IBM Websphere 8中使用axis2(Sales Force)访问web服务时出现java异常   翻译如何从java翻译网页?   java Spring MongoRepository#findall:ConverterNotFoundException   使用Ecplipse导出时,java无法使我的程序可执行   Java:ArrayList。清除从传递到映射的ArrayList中删除元素   javascript在@RequestBody中如何防止java spring启动中出现盲目XSS   dcoder中hello world教程的java问题   java Android内存不足事件   用于从模板生成对象的JavaEJB3.1模式   java如何使DatePickerDialog在更改屏幕方向时保持选定的用户日期?   未收到python Java HTTP cookies   java Google驱动器脚本不工作,