如何在丢失的csv字段中插入默认值？

def fillBlanks(): HEADERS = ['ST','Year','PCT_SHORT','PCT_V_SHORT','Year','PCT_SHORT', 'PCT_V_SHORT','Year','PCT_SHORT','PCT_V_SHORT' ] fileH = open(outputDir+"PCT_SHORT_V_SHORT.csv", 'rb') reader = csv.DictReader(fileH, HEADERS) for row in reader: if any(row[key] in (None, "") for key in row): print "bad"+ str(row) fileH.close()

1条回答

网友

1楼 · 发布于 2024-06-02 05:48:51

DictReader有一个restval参数来设置缺失字段的默认值。在

但对于缺失的领域。。。在读取值的末尾，即：行中的字段比预期的少。在

在您的问题中不清楚您丢失的字段是在末尾还是在链的任何地方。或者如果缺少意味着将有两个连续的分隔符。在

另外，DictReader可能不是您最好的朋友：HEADERS定义中的某些字段具有相同的名称，因此将写入同一个键。如果这不是您的意图，您应该为每个头指定一个唯一的名称。在

编辑：跟随评论

下面代码中的头为每个csv字段提供了唯一的id，缺少的字段将用传递的值missing或{}填充。在

有了它，DictReader可以将每个读取的csv字段分配给各个键，或者用restval填充。在

DictWriter撤消该操作，并用已解析（可能已填充）的csv数据将其写回outpath

def fillBlanks(inpath, outpath, missing=None, writeheaders=False):
    # Assign unique identifiers in HEADERS to each csv field
    HEADERS = [
        'ST',
        'Year_1', 'PCT_SHORT_1', 'PCT_V_SHORT_1',
        'Year_2', 'PCT_SHORT_2', 'PCT_V_SHORT_2',
        'Year_3', 'PCT_SHORT_3', 'PCT_V_SHORT_3'
    ]

    # Open and parse file with default value for missing
    rfile = open(inpath, 'r')
    reader = csv.DictReader(rfile, fieldnames=HEADERS, restval=missing or '0')

    # Open and write to file with writer
    wfile = open(outpath, 'w')
    writer = csv.DictWriter(wfile, fieldnames=HEADERS)

    if writeheaders:
        writer.writeheaders()

    # Write each row from reader to writer
    for row in reader:
        writer.writerow(row)

相关问题更多 >

编程相关推荐

热门问题

热门文章