在Datafram中查找互惠行

gpm = pd.DataFrame(data={ 'id':[1,2,3,4,5,6,7,8,9], 'time':[150315,150315,150315,150315,150315,150315,150315,150315,150315], 'numA':['A','D','C','B','A','C','A','E','D'], 'numB':['B','C','B','A','B','D','B','A','A'], 'antA':['MSPDV','VIELU','RMPC1','MJCIH','PALT2','M2PV3','MACIF','MACIF','VIELU'], 'antB':['BPDV8','0GRI3','SSFDJ','SSFDJ','SSFDJ','CCPG1','0GRI3','SSFDJ','SSFDJ'] })

## here's my code parties = {} nums = gpm['numA']+gpm['numB'] for i in nums.unique(): parties[i] = gpm['numB'][gpm['numA'] == i] parties[i] = gpm['numA'][gpm['numB'] == i] new_d = gpm.iloc[[0]] for i in np.arange(1,gpm.shape[0]): numa = gpm.iloc[i]['numA'] if gpm.iloc[i]['numB'] in parties[numa]: new_d.append(gpm.iloc[[i]])

1条回答

网友

1楼 · 发布于 2024-06-16 12:04:47

在您的示例中，我假设id=3、8和9的行（C、B）、（E、A）和（D、A）是不需要的？如果是这样的话，这里有一个标准的选择方法，通过比较numA和numB中的值来选择特定的可接受组合：

In [5]: gpm[((gpm['numA'] == 'A') & (gpm['numB'] == 'B')) |
   ...:     ((gpm['numA'] == 'B') & (gpm['numB'] == 'A')) |
   ...:     ((gpm['numA'] == 'C') & (gpm['numB'] == 'D')) | 
   ...:     ((gpm['numA'] == 'D') & (gpm['numB'] == 'C'))
   ...: ]
Out[5]:
   id    time numA numB   antA   antB
0   1  150315    A    B  MSPDV  BPDV8
1   2  150315    D    C  VIELU  0GRI3
3   4  150315    B    A  MJCIH  SSFDJ
4   5  150315    A    B  PALT2  SSFDJ
5   6  150315    C    D  M2PV3  CCPG1
6   7  150315    A    B  MACIF  0GRI3

（将结果赋给new_d）

相关问题更多 >

编程相关推荐

热门问题

热门文章