从嵌套字典中的文件中读取最初未知数量的N行，然后在下一次迭代的第N+1行开始

line1: stuff, stuff2, stuff3, ID1, stuff4, stuff5 line2: stuff, stuff2, stuff3, ID1, stuff4, stuff5 line3: stuff, stuff2, stuff3, ID1, stuff4, stuff5 line4: stuff, stuff2, stuff3, ID2, stuff4, stuff5 line5: stuff, stuff2, stuff3, ID2, stuff4, stuff5 ...

2条回答

网友

1楼 · 编辑于 2024-05-19 18:19:17

您可以使用字典来跟踪所有IDX列，只需将每行的IDX列添加到字典中相应的列表中，类似于：

from collections import defaultdict
import csv

all_lines_dict = defaultdict(list)

with open('your_file') as f:
  csv_reader = csv.reader(f)            
  for line_list in csv_reader:
    all_lines_dict[line_list[3]].append(line_list)

Csv reader是python标准库的一部分，它使csv文件的读取变得容易。它将把每一行作为列的列表来读取。在

这与您的要求不同，因为每个键不是字典的字典，而是共享IDX键的行的列表。在

网友

2楼 · 编辑于 2024-05-19 18:19:17

如果希望此函数为每个id懒洋洋地返回dict，则应使用yield而不是return使其成为生成器函数。在每个id的末尾，生成该id的dict，然后可以迭代该生成器。在

要处理该文件，请编写一个生成器函数，该函数迭代源代码，除非您向它发送一个值，在这种情况下，它接下来返回该值，然后返回迭代。（例如，这里有一个我自己编写的模块：politer.py。）

然后，如果您不希望，可以通过发送值“back”来轻松解决此问题：

with open(infile, 'r') as f:
    polite_f = politer(f)
    current_id = None
    while True:
        id_dict = {}
        for i, line in enumerate(polite_f):
            id = get_id_from_line(line)
            if id != current_id:
                polite_f.send(line)
                break
            else:
                id_dict[i] = process_line(line)
        if current_id is not None:
            yield id_dict
        current_id = id

请注意，这使状态处理在它所属的生成器中保持抽象。在

相关问题更多 >

编程相关推荐

热门问题

热门文章