如何根据每行的内容对文本文件中的行进行分组？

12277 17/06/2019 350 BJ201AB FMACRI 0 J 52 4081.15 166851 0 J 52 4496.64 166852 0 J 52 5139.07 166855 0 J 52 5773.82 166858 J E 70 25 B159681 12509 21/06/2019 443 DH717WF BLANCO B J 42 5376.63 5164/A 12504 21/06/2019 443 EB631NF LUCCIG B J 44 5567.46 5165/A 0 J 52 5347.58 166950 0 J 52 4742.4 166953 0 J 18 1146.24 427876 0 J 4 0.4 427877 J 0 372 1 B159763 R 0 1567 1 B159764

[ ['12277', '17/06/2019', '350', 'BJ201AB', 'FMACRI'], ['', '', '', '', '', '0', 'J', '52', '4081.15', '166851'], ['', '', '', '', '', '0', 'J', '52', '4496.64', '166852'], ['', '', '', '', '', '0', 'J', '52', '5139.07', '166855'], ['', '', '', '', '', '0', 'J', '52', '5773.82', '166858'], ['', '', '', '', '', 'J', 'E', '70', '25', 'B159681'], ['12509', '21/06/2019', '443', 'DH717WF', 'BLANCO'], ['', '', '', '', '', 'B', 'J', '42', '5376.63', '5164/A'], ['12504', '21/06/2019', '443', 'EB631NF', 'LUCCIG'], ['', '', '', '', '', 'B', 'J', '44', '5567.46', '5165/A'], ... ]

shipments = [] shuttle_lst = [] for line in data[1:]: if len(line[0]) < 1: shipments.append(line) else: shuttle = data[data.index(line) - (len(shipments) + 1)] shipments.append(shuttle) new_lst = [lst for lst in shipments] shuttle_lst.append(new_lst) shipments.clear()

1条回答

网友
1楼 · 发布于 2024-05-19 18:19:01

如果我理解正确，你想根据标题行对行进行分组，标题行不以空格开头，对吗？你知道吗
考虑以下几点：
import pprint pp = pprint.PrettyPrinter(indent=4) # A list of lists data = [] with open('data.dat') as f: for line in f: if line.startswith(" ") or line.startswith("\t"): if not data: raise RuntimeError("Wrong data - first line is not legit") data[-1].append(line.split()) continue # If here, this is a header line data.append([line.split()]) pp.pprint(data)
这张照片：
[ [ ['12277', '17/06/2019', '350', 'BJ201AB', 'FMACRI'], ['0', 'J', '52', '4081.15', '166851'], ['0', 'J', '52', '4496.64', '166852'], ['0', 'J', '52', '5139.07', '166855'], ['0', 'J', '52', '5773.82', '166858'], ['J', 'E', '70', '25', 'B159681']], [ ['12509', '21/06/2019', '443', 'DH717WF', 'BLANCO'], ['B', 'J', '42', '5376.63', '5164/A']], [ ['12504', '21/06/2019', '443', 'EB631NF', 'LUCCIG'], ['B', 'J', '44', '5567.46', '5165/A'], ['0', 'J', '52', '5347.58', '166950'], ['0', 'J', '52', '4742.4', '166953'], ['0', 'J', '18', '1146.24', '427876'], ['0', 'J', '4', '0.4', '427877'], ['J', '0', '372', '1', 'B159763'], ['R', '0', '1567', '1', 'B159764']]]
结果是一个列表列表。每个第二级列表的第一项是标题行，其余的是该组中的行

相关问题更多 >

编程相关推荐

热门问题

热门文章