基于第1列合并行的Python脚本

2144, 2016, 505, 20005, 2007, PP, GPP, DAC, UNSW 8432, 2015, 505, 20005, 2041, LL, GLO, X2, UNSW 0055, 0.00, 0.00, 2014, 2017 2144, 0.00, 0.00, 2016, 959 8432, 22.9, 0.00, 2015, 2018 0055, 2014, 505, 20004, 2037, LL, GLO, X2, QAL

2144, 0.00, 0.00, 2016, 959, 2016, 505, 20005, 2007, PP, GPP, DAC, UNSW 0055, 0.00, 0.00, 2014, 2017, 2014, 505, 20004, 2037, LL, GLO, X2, QAL 8432, 22.9, 0.00, 2015, 2018, 2015, 505, 20005, 2041, LL, GLO, X2, UNSW

reader = csv.reader(open('input.csv)) result = {} for row in reader: idx = row[0] values = row[1:] if idx in result: result[idx] = [result[idx][i] or v for i, v in enumerate(values)] else: result[idx] = values

1条回答

网友

1楼 · 发布于 2024-06-10 05:13:09

尝试使用字典，第一列的值作为键。我会这样做：

with open('myfile.csv') as csvfile:
    reader = list(csv.reader(csvfile, skipinitialspace=True))  # remove the spaces after the commas
    result = {}  # or collections.OrderedDict() if the output order is important
    for row in reader:
        if row[0] in result:
            result[row[0]].extend(row[1:])  # do not include the key again
        else:
            result[row[0]] = row

    # result.values() returns your wanted output, for example :
    for row in result.values():
        print(', '.join(row))

相关问题更多 >

编程相关推荐

热门问题

热门文章