在第二列中的每个匹配项的一个数据帧列中查找索引

import pandas as pd df = pd.DataFrame({'current':['a','aa','ab','aaa','aab','aba','abb'], 'previous':['','a','a','aa','aa','ab','ab']}) df['idx_previous'] = '' for previous in df.previous[1:]: df.loc[df.previous==previous, 'idx_previous'] = df.loc[df.current == previous].index[0]

1条回答

网友

1楼 · 发布于 2024-04-26 02:19:04

您可以创建一个系列s，它反转df['current']的映射。然后将其与pd.Series.map一起使用：

s = pd.Series(df.index, index=df['current'].values)
df['idx_previous'] = df['previous'].map(s)

print(df)

  current previous  idx_previous
0       a                    NaN
1      aa        a           0.0
2      ab        a           0.0
3     aaa       aa           1.0
4     aab       aa           1.0
5     aba       ab           2.0
6     abb       ab           2.0

此解决方案依赖于df['current']的值是唯一的，否则您的需求是不明确的。此外，由于NaN是一个float值，因此，非映射值（例如第一行）的存在导致NaN并强制df['idx_previous']向上转换为float

相关问题更多 >

编程相关推荐

热门问题

热门文章

在第二列中的每个匹配项的一个数据帧列中查找索引

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >