从大型.csv fi中清除格式错误的记录

2024-03-28 13:53:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个大的.csv文件,我想用python脚本来处理它,找到所有“格式错误”的值,例如那些值大于或小于报头数的值,并消除它们。在

最好的办法是什么?在


Tags: 文件csv脚本格式错误办法头数
1条回答
网友
1楼 · 发布于 2024-03-28 13:53:30

下面是一个基本示例:

num_headers = 5
with open("input.csv", 'r') as file_in, open("output.csv", 'w') as file_out:
    for i, line in enumerate(file_in):
        if len(line.split(",")) == num_headers:
            file_out.write(line)
        else:
            print "line %d is malformed" % i

或使用csv模块(对于不同类型的csv格式更为灵活):

^{pr2}$

相关问题 更多 >