在磁盘上而不是内存中对大型csv文件进行排序

typedcsvsort的Python项目详细描述


CSV排序

用于排序磁盘上不适合内存的csv文件。合并排序算法用于将原始文件分解为较小的块,在内存中对这些块进行排序,然后合并这些排序的文件。

示例用法

>>>fromcsvsortimportcsvsort>>># sort this CSV on the 5th(str) and 3rd(int) columns (columns are 0 indexed)>>>csvsort('test1.csv',[4,2],["str","int"])>>># sort this CSV with no header on 4th column and save results to separate file>>>csvsort('test2.csv',[3],["str"],output_file='test3.csv',has_header=False)>>># sort this TSV on the first column and use a maximum of 10MB per split>>>csvsort('test3.tsv',[0],["str"],max_size=10,delimiter='\t')>>># sort this CSV on the first column and force quotes around every field (default is csv.QUOTE_MINIMAL)>>>importcsv>>>csvsort('test4.csv',[0],["str"],quoting=csv.QUOTE_ALL)

安装

支持python 2&3:

$ pip install csvsort
$ pip3 install csvsort

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JavaPax考试:从非标准Maven存储库解析Karaf特性存储库(XML文件)   java Spring启动Bean创建异常   java中将ArrayList转换为数组的方法   Android Studio的java Unity插件。   java在CheckStyle中从方法计数中排除getter和setter   HibernateJava。sql。SQLSyntaxErrorException:表/视图“序列”不存在   与命令行程序Java vs C通信   java WebView膨胀异常   java在O(n)java8流中寻找两个列表的交集   java使用Gradle运行单元测试时,最大堆大小在哪里设置?   ssl加载java应用程序(CXF)内的jks文件   CI:Jenkins Git:Simple Java项目:希望在特定时间在脚本上发送消息   java根据位置更改数字   java按数值排序字符串数组   macos java版本“1.6.0_65”是否与java 6模棱两可?   Cassandra中的java时间戳