在此数据帧上正确应用cumcount

ProductNumber ProductVersion DateStarted AX1 R1 2018-01-01 AX1 R1 2018-01-02 AX1 R2 2018-01-03 AX1 R3 2018-01-04 AX1 R3 2018-01-05 BX1 R1 2018-01-01 BX1 R1 2018-01-02 AX1 R5 2018-01-03 AX1 R5 2018-01-04 AX1 R5 2018-01-05

ProductNumber ProductVersion DateStarted Count AX1 R1 2018-01-01 0 AX1 R1 2018-01-02 1 AX1 R2 2018-01-03 0 AX1 R3 2018-01-04 0 AX1 R3 2018-01-05 1 BX1 R1 2018-01-01 0 BX1 R1 2018-01-02 1 AX1 R5 2018-01-03 0 AX1 R5 2018-01-04 1 AX1 R5 2018-01-05 2

df['count'] =(df.drop_duplicates(['ProductNumber','ProductVersion', 'DateStarted']) .groupby(['ProductNumber', 'ProductVersion'])['DateStarted'] .cumcount()) df['count'] = df['count'].ffill().astype(int)

ProductNumber ProductVersion DateStarted Count AX1 R1 2018-01-01 0 AX1 R1 2018-01-02 0 AX1 R2 2018-01-03 1 AX1 R3 2018-01-04 0 AX1 R3 2018-01-05 1 BX1 R1 2018-01-01 0 BX1 R1 2018-01-02 0 AX1 R5 2018-01-03 0 AX1 R5 2018-01-04 1 AX1 R5 2018-01-05 1

1条回答

网友

1楼 · 发布于 2024-06-16 16:27:45

你的方法是正确的，如果你只是剃掉一些东西：

df['Count'] = df.groupby(['ProductNumber', 'ProductVersion']).cumcount()
df

输出：

  ProductNumber ProductVersion DateStarted  Count
0           AX1             R1  2018-01-01      0
1           AX1             R1  2018-01-02      1
2           AX1             R2  2018-01-03      0
3           AX1             R3  2018-01-04      0
4           AX1             R3  2018-01-05      1
5           BX1             R1  2018-01-01      0
6           BX1             R1  2018-01-02      1
7           AX1             R5  2018-01-03      0
8           AX1             R5  2018-01-04      1
9           AX1             R5  2018-01-05      2

相关问题更多 >

编程相关推荐

热门问题

热门文章