当列匹配时，从两个DataFrame筛选数据

import pandas as pd # 1st data set dat0 = [['A0', 'B0', 'C0', 'case0', 1], ['A0', 'B2', 'C0', 'case0', 2], ['A1', 'B0', 'C0', 'case0', 3], ['A1', 'B1', 'C0', 'case0', 4], ['A0', 'B0', 'C1', 'case0', 5]] df0 = pd.DataFrame(dat0, columns=['colA', 'colB', 'colC', 'colCase', 'colVal']) # 2nd data set dat1 = [['A0', 'B1', 'C2', 'case1', 6], ['A0', 'B2', 'C2', 'case1', 7], ['A1', 'B0', 'C2', 'case1', 8], ['A2', 'B2', 'C2', 'case1', 9]] df1 = pd.DataFrame(dat1, columns=['colA', 'colB', 'colC', 'colCase', 'colVal'])

# Merge the DataFrames df = pd.concat([df0, df1]) # maybe concat is not a good starting point for a in ['A0', 'A1', 'A2']: for b in ['B0', 'B1', 'B2']: table = my_great_function(df, a, b) if table: print '---' print table

--- colA colB colC colCase colVal 1 A0 B2 C0 case0 2 1 A0 B2 C2 case1 7 --- colA colB colC colCase colVal 2 A1 B0 C0 case0 3 2 A1 B0 C2 case1 8

1条回答

网友

1楼 · 发布于 2024-05-14 21:23:15

你可以做类似的事情。如果不完全是您想要的，则相应地修改条件（这里每个g表示一个子数据帧，具有colA和colB的唯一组合）：

for _, g in df.groupby(["colA", "colB"]):
    case_lst = g.colCase.tolist()
    if 'case0' in case_lst and 'case1' in case_lst:
        print("    ")
        print(g)

    
  colA colB colC colCase  colVal
1   A0   B2   C0   case0       2
1   A0   B2   C2   case1       7
    
  colA colB colC colCase  colVal
2   A1   B0   C0   case0       3
2   A1   B0   C2   case1       8

相关问题更多 >

编程相关推荐

热门问题

热门文章