将数据帧中的行中的元组列表转换为一个元组列表

InvoiceNo Description 534 [(AB, AC), (ACBO, PPK)] 415 [(AD, AT), (CBO, PKD), (CBO, PKA)] 315 [(FDC, ATO), (VBO, IKD), (CVB, PKD)] Desired output: Edges = [(AB, AC), (ACBO, PPK), (AD, AT), (CBO, PKD), (CBO, PKA), (FDC, ATO), (VBO, IKD), (CVB, PKD)]

3条回答

网友

1楼 · 编辑于 2024-05-21 00:03:54

对于行数，重复的边是否会给应用程序带来问题

如果是，请考虑SET类型而不是列表。然后，您可以使用jezrael的美丽理解一行加{}：

Edges = {y for x in df.Description for y in x}

网友

2楼 · 编辑于 2024-05-21 00:03:54

将列表理解与扁平嵌套元组列表一起使用：

Edges = [y for x in df.Description for y in x]
print (Edges)
[('AB', 'AC'), ('ACBO', 'PPK'), ('AD', 'AT'), ('CBO', 'PKD'), 
 ('CBO', 'PKA'), ('FDC', 'ATO'), ('VBO', 'IKD'), ('CVB', 'PKD')]

或chain.from_iterable以获得更好的性能：

from  itertools import chain

Edges = list(chain.from_iterable(df.Description))
print (Edges)
[('AB', 'AC'), ('ACBO', 'PPK'), ('AD', 'AT'), ('CBO', 'PKD'), 
 ('CBO', 'PKA'), ('FDC', 'ATO'), ('VBO', 'IKD'), ('CVB', 'PKD')]

网友

3楼 · 编辑于 2024-05-21 00:03:54

对于熊猫版本1+，也可以使用“分解”方法：

df['Description'].explode().tolist()

输出：

[('AB', 'AC'), ('ACBO', 'PPK'), ('AD', 'AT'), ('CBO', 'PKD'), ('FDC', 'ATO'), ('VBO', 'IKD'), ('CVB', 'PKD')]

相关问题更多 >

编程相关推荐

热门问题

热门文章

将数据帧中的行中的元组列表转换为一个元组列表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >