当列匹配时,从两个DataFrame筛选数据

2024-05-14 21:23:15 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有以下两个pandas.DataFramedf0df1

import pandas as pd

# 1st data set
dat0 = [['A0', 'B0', 'C0', 'case0', 1],
        ['A0', 'B2', 'C0', 'case0', 2],
        ['A1', 'B0', 'C0', 'case0', 3],
        ['A1', 'B1', 'C0', 'case0', 4],
        ['A0', 'B0', 'C1', 'case0', 5]]
df0 = pd.DataFrame(dat0, columns=['colA', 'colB', 'colC', 'colCase', 'colVal'])

# 2nd data set
dat1 = [['A0', 'B1', 'C2', 'case1', 6],
        ['A0', 'B2', 'C2', 'case1', 7],
        ['A1', 'B0', 'C2', 'case1', 8],
        ['A2', 'B2', 'C2', 'case1', 9]]
df1 = pd.DataFrame(dat1, columns=['colA', 'colB', 'colC', 'colCase', 'colVal'])

我试图得到所有的行,对于每两列(A,B),case0和case1都有一个值(即每个DF中都有一个值)。你知道吗

如果有关系,我不能在DataFrames中有“复制”行:集合(A,B,C,case)在每个DF中都是唯一的。你知道吗

所以我想得到一个代码,看起来像:

# Merge the DataFrames
df = pd.concat([df0, df1])  # maybe concat is not a good starting point

for a in ['A0', 'A1', 'A2']:
    for b in ['B0', 'B1', 'B2']:
        table = my_great_function(df, a, b)
        if table:
            print '---'
            print table

得到如下结果:

---
  colA colB colC colCase  colVal
1   A0   B2   C0   case0       2
1   A0   B2   C2   case1       7
---
  colA colB colC colCase  colVal
2   A1   B0   C0   case0       3
2   A1   B0   C2   case1       8

注意,我不想在只有一行出现的情况下得到结果,也不想在两行或更多行出现在相同的情况下得到结果。你知道吗

有什么建议吗?你知道吗


Tags: dataframea1b0a0b2pdc2c0
1条回答
网友
1楼 · 发布于 2024-05-14 21:23:15

你可以做类似的事情。如果不完全是您想要的,则相应地修改条件(这里每个g表示一个子数据帧,具有colA和colB的唯一组合):

for _, g in df.groupby(["colA", "colB"]):
    case_lst = g.colCase.tolist()
    if 'case0' in case_lst and 'case1' in case_lst:
        print("    ")
        print(g)

    
  colA colB colC colCase  colVal
1   A0   B2   C0   case0       2
1   A0   B2   C2   case1       7
    
  colA colB colC colCase  colVal
2   A1   B0   C0   case0       3
2   A1   B0   C2   case1       8

相关问题 更多 >

    热门问题