name job id_number
0 krul painter 125796
1 tim lawyer 789632
2 daisy engg 256498
3 alex dancer 456985
4 mandy arch 456258
5 krul painter 125796
6 tim lawyer 789632
7 tim lawyer 789632
8 tim lawyer 789632
9 daisy engg 256498
10 daisy engg 256498
输出:
dup_Index min_index
0 0
5 0
2 2
9 2
10 2
6 6
7 7
8 8
尽管我无法从这个问题中看出分组背后的意图,但如果您想查看唯一的事件及其(重复的)索引,您可以始终求助于分组
df.groupby(('name', 'job', 'id_number'),as_index=True).apply(lambda x: x.index.tolist())
输出:
然后可以应用各种查询来获取列表的长度和第一个列表
根据你需要它做什么,可能有更好的方法,比如看@Quang Hoang的答案
IIUC,
duplicated
和transform('idxmin')
表示最小行数:输出:
相关问题 更多 >
编程相关推荐