在两个Pandas数据帧中查找一对多匹配

Data examples: Large Transaction Size: AID AIssue Date AAmount 1508 3/14/2018 -560 1506 3/27/2018 -35 1500 4/25/2018 5000 Small Transaction Size: BID BIssue Date BAmount 1063 3/6/2018 -300 1062 3/6/2018 -260 839 3/22/2018 -35 423 4/24/2018 5000 Expected Results AID AIssue Date AAMount BID BIssue Date BAmount 1508 3/14/2018 -560 1063 3/6/2018 -300 1508 3/14/2018 -560 1062 3/6/2018 -260 1506 3/27/2018 -35 839 3/22/2018 -35 1500 4/25/2018 5000 423 4/24/2018 5000 but I usually get AID AIssue Date AAMount BID BIssue Date BAmount 1508 3/14/2018 -560 1063 3/6/2018 -300 1508 3/14/2018 -560 1062 3/6/2018 -260 1506 3/27/2018 -35 839 3/22/2018 -35

2条回答

网友

1楼 · 编辑于 2024-06-07 23:51:07

在我的模块iterate“one”to“u many”中，我计算的行长度不正确。我需要替换

end_row = len(dfLarge.columns[dID]) - 1

与

^{pr2}$

网友

2楼 · 编辑于 2024-06-07 23:51:07

IIUUC，匹配只是在大的DataFrame中查找事务，该事务是在小事务中的事务上或与事务最近的未来事务。您可以使用pandas.merge_asof()根据将来最近的日期执行匹配。在

import pandas as pd
# Ensure your dates are datetime
df_large['AIssue Date'] = pd.to_datetime(df_large['AIssue Date'])
df_small['BIssue Date'] = pd.to_datetime(df_small['BIssue Date'])

merged = pd.merge_asof(df_small, df_large, left_on='BIssue Date', 
                       right_on='AIssue Date', direction='forward')

merged现在是：

^{pr2}$

如果你期望事情永远不匹配，你也可以抛出一个tolerance将匹配限制在一个较小的窗口内，这样一来，DataFrame中缺少的值不会将所有内容都丢弃。在

相关问题更多 >

编程相关推荐

热门问题

热门文章