加速交叉参考滤波

TRANSACTION_ID BACK_REFERENCE_TRAN_ID_NUMBER CONTRIBUTION_AMOUNT 0 VR0P4H2SEZ1 0 100 1 VR0P4H3X770 0 2700 2 VR0P4GY6QV1 0 500 3 VR0P4H3X720 0 1700 4 VR0P4GYHHA0 VR0P4GYHHA0E 200

is_from_conduit = df[df.BACK_REFERENCE_TRAN_ID_NUMBER != "0"].BACK_REFERENCE_TRAN_ID_NUMBER.tolist() df['CONDUIT_FOR_OTHER_DONATION'] = 0 for row in df.index: if df['TRANSACTION_ID'][row] in is_from_conduit: df['CONDUIT_FOR_OTHER_DONATION'][row] = 1 else: df['CONDUIT_FOR_OTHER_DONATION'][row] = 0

2条回答

网友

1楼 · 编辑于 2024-05-23 14:50:01

您可以使用^{}。它是一个向量化操作，用于检查序列中的每个元素是否在提供的iterable中。你知道吗

df['CONDUIT_FOR_OTHER_DONATION'] = df['TRANSACTION_ID'].isin(df['BACK_REFERENCE_TRAN_ID_NUMBER'].unique())

如@root所述，如果您喜欢0/1（如您的示例中所示）而不是True/False，您可以强制转换为int：

df['CONDUIT_FOR_OTHER_DONATION'] = df['TRANSACTION_ID'].isin(df['BACK_REFERENCE_TRAN_ID_NUMBER'].unique()).astype(int)

网友

2楼 · 编辑于 2024-05-23 14:50:01

下面是一个基于NumPy的方法，使用^{}-

vals = np.in1d(df.TRANSACTION_ID,df.BACK_REFERENCE_TRAN_ID_NUMBER).astype(int)
df['CONDUIT_FOR_OTHER_DONATION'] = vals

相关问题更多 >

编程相关推荐

热门问题

热门文章