Pandas：对于已排序序列B的所有元素，查找已排序序列A中最近元素的索引

A B closest_match_idx match_diff output 0 17 15 0 2 17 1 18 18 1 0 18 2 19 20 3 1 20 3 20 21 3 1 20 4 22 21 3 1 20 5 23 27 5 4 23

1条回答

网友

1楼 · 发布于 2024-05-26 16:28:06

您可以使用^{}。这需要对帧进行排序。这有利于它支持^ {< CD2> }参数，允许您在其中考虑匹配的卡尺。

我将在附加的'A_match'列中留下，但是如果您不需要它，可以将其删除

res = pd.merge_asof(df.sort_values('B'), 
                    df.rename_axis(index='closest_idx').reset_index().drop(columns='B').sort_values('A'),
                    left_on='B', right_on='A',
                    direction='nearest',
                    suffixes=['', '_match'])

print(res)

    A   B  closest_idx  A_match
0  17  15            0       17
1  18  18            1       18
2  19  20            3       20
3  20  21            3       20
4  22  21            3       20
5  23  27            5       23

将公差设置为|距离|<；=一,

res = pd.merge_asof(df.sort_values('B'), 
                    df.rename_axis(index='closest_idx').reset_index().drop(columns='B').sort_values('A'),
                    left_on='B', right_on='A',
                    direction='nearest',
                    suffixes=['', '_match'],
                    tolerance=1)

#    A   B  closest_idx  A_match
#0  17  15          NaN      NaN
#1  18  18          1.0     18.0
#2  19  20          3.0     20.0
#3  20  21          3.0     20.0
#4  22  21          3.0     20.0
#5  23  27          NaN      NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：对于已排序序列B的所有元素，查找已排序序列A中最近元素的索引

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >