试图读取一个大的csv文件和concat太多

2024-06-02 08:00:34 发布

男 | 程序猿一只，喜欢编程写python代码。

我试图读取一个大的csv文件（超过100gb）
我找到了使用chunksize选项读取大型csv文件的方法

%%time
import time
filename = "../code/csv/file.csv"
lines_number = sum(1 for line in open(filename))
lines_in_chunk = 100# I don't know what size is better
counter = 0
completed = 0
reader = pd.read_csv(filename, chunksize=lines_in_chunk)

这部分非常快
但问题是串联

%%time
df = pd.concat(reader,ignore_index=True)

这花了4个多小时，还没有完成。
ram内存使用量也在不断增长

有没有办法更快更有效地合并这个读卡器文件

Tags：文件 csv 方法 in import time 选项 code

0条回答

目前没有回答

编程相关推荐

java基于条件如何创建StringBuffers并向其添加数据
java如何用UNC路径解决“不表示可正确访问的目录”异常？
在执行提取方法重构后，java代码的速度降低了6倍
java如何修改LDAPCertStore中用于X509证书链验证的LDAP连接属性
awt如何在Java中捕获鼠标光标？
字符串如何设置Java输出流
java NumberFormatException:用于输入字符串：“8:00”
unix/linux“tail f”的Java IO文件实现
java打印输出。带有JOptionPane的txt文件
java解组总是显示0和null

试图读取一个大的csv文件和concat太多

相关问题更多 >

编程相关推荐

热门问题

热门文章

试图读取一个大的csv文件和concat太多

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >