Concat两个DF，不包括不在一个DF中的行

df1 id_event id_indiv odds 0 11545 3131 0.185185 1 11545 4529 0.088106 2 11545 9168 0.055402 3 11545 12922 0.088106 4 11545 12929 0.270270 5 11545 19936 0.037523 6 11545 24703 0.202020 7 11545 25951 0.043573 8 11545 26397 0.029762 9 11545 28177 0.219780 df2 id_event id_indiv final_odds 0 11545 3131 0.215054 1 11545 4526 -1.000000 2 11545 4529 0.060423 3 11545 9168 0.050251 4 11545 12922 0.060423 5 11545 12929 0.250000 6 11545 19936 0.019900 7 11545 24703 0.392157 8 11545 25951 0.052910 9 11545 26397 0.034014 10 11545 28177 0.377358

df3 id_event id_indiv odds final_odds 0 11545 3131 0.185185 0.215054 1 11545 4529 0.088106 0.060423 2 11545 9168 0.055402 0.050251 3 11545 12922 0.088106 0.060423 4 11545 12929 0.270270 0.250000 5 11545 19936 0.037523 0.019900 6 11545 24703 0.202020 0.392157 7 11545 25951 0.043573 0.052910 8 11545 26397 0.029762 0.034014 9 11545 28177 0.219780 0.377358

temp_df = df1.drop(df2[df2['id_indiv'] !=df1['id_indiv'] | df2['id_event'] != df1['id_event']].index ) ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

2条回答

网友

1楼 · 编辑于 2024-05-16 11:06:56

让我们让它变得更简单，只要做merge

df2.drop(df2[df2['final_odds'] < 0].index, inplace = True)
m = df1[['id_event','id_indiv']].agg(tuple,1).isin(df1[['id_event','id_indiv']].agg(tuple,1))
df1 = df1[m]

还有merge

df2.drop(df2[df2['final_odds'] < 0].index, inplace = True)
df1 = df1.merge(df2.drop_duplicates(['id_event','id_indiv']),how='right')

网友

2楼 · 编辑于 2024-05-16 11:06:56

A）如果您认为id列中存在重复项

首先，让我们获取您感兴趣的df2的子集

df2_subset = df2[df2['final_odds']>=0]

# Then, eliminate duplicates based on the subset ['id_event','id_indiv']
df2_subset = df2_subset.groupby(['id_event','id_indiv'], as_index=False).nth(0)

一旦我们有了df2_子集，我们就可以合并了

df3 = df1.merge(df2, on=['id_event','id_indiv'],how='left')

B）如果您知道id列中没有重复项

你只需一行就可以解决你的问题

df3 = df1.merge(df2[df2['final_odds']>=0], on=['id_event','id_indiv'],how='left')

相关问题更多 >

编程相关推荐

热门问题

热门文章