通过python使用多组的ngroup

1条回答

网友

1楼 · 发布于 2024-06-10 06:52:09

由于您似乎希望在每个id2组中有一组数量的id1，因此您需要做的是两个.groupby()操作（每个组中有一个groupby）：

# reproducible (copy/paste) setup
df = pd.DataFrame({
    'id1': [1123, 1123, 1124, 1124, 1125, 1125, 1125, 1126, 1126, 1127],
    'id2': [123, 123, 123, 123, 123, 123, 123, 122, 122, 122]})

out = df.assign(
    row_id=df
    .groupby('id2', group_keys=False)
    .apply(lambda g: g.groupby('id1').ngroup()) + 1)

给出：

>>> out
    id1  id2  row_id
0  1123  123       1
1  1123  123       1
2  1124  123       2
3  1124  123       2
4  1125  123       3
5  1125  123       3
6  1125  123       3
7  1126  122       1
8  1126  122       1
9  1127  122       2

注意：这将处理df未排序的情况：

>>> df = df.sample(frac=1)
>>> df
    id1  id2
8  1126  122
2  1124  123
6  1125  123
5  1125  123
7  1126  122
1  1123  123
3  1124  123
9  1127  122
4  1125  123
0  1123  123

以及：

out = df.assign(
    row_id=df
    .groupby('id2', group_keys=False)
    .apply(lambda g: g.groupby('id1').ngroup()) + 1)

给出：

>>> out
    id1  id2  row_id
8  1126  122       1
2  1124  123       1
6  1125  123       2
5  1125  123       2
7  1126  122       1
1  1123  123       3
3  1124  123       1
9  1127  122       2
4  1125  123       2
0  1123  123       3

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过python使用多组的ngroup

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >