如何将CSV列表规范化为2个或更多个独立文件？

1条回答

网友

1楼 · 发布于 2024-06-16 11:37:48

你可以用字典。使用投票位置作为关键字，对于相应的值，列出在那里登记的选民的列表：

import csv
from collections import OrderedDict


data = OrderedDict()
with open('input.txt') as f:
    reader = csv.reader(f, delimiter='|')
    for row in reader:
        row = [e.strip() for e in row]
        person   = row[0]
        location = (row[1], row[2])

        if location not in data: data[location] = []

        data[location].append(person)

# Show voting places
print("Voting places (voting_place_id, voting_place):")
for (i,k) in enumerate(data):
    print("  %3d %s" % (i,k))
print("")

# Show voters
print("Voters (voting_place_id, person):")
for (i,k) in enumerate(data):
    for p in data[k]:
        print("  %3d %s" % (i,p))
print("")

输出：

^{pr2}$

在运行此脚本之间没有保存状态，因此，如果您使用一半的数据集运行它一次，然后再运行其余的数据集，那么相同的“位置id”将被重用，而不考虑第一次运行时生成的id。在

但是，如果您将数据附加到原始数据，并再次运行该程序，则第一次运行生成的id将与第二次运行生成的id相匹配，前提是第一次出现的行中没有任何更改（这就是为什么我们使用OrderedDict而不是dict）。在

如果需要持久状态，可以在运行之间始终^{}和{}字典。或者将已排序的键转储到一个文件中，并用这些键初始化data字典。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将CSV列表规范化为2个或更多个独立文件？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >