计算列的前置项并创建这些计数的新变量

ID Class 1 A 1 A 2 A 1 B 1 B 1 B 2 B 1 C 1 C 2 A 2 A 2 A

ID Class Counts 1 A 0 1 A 1 2 A 0 1 B 0 1 B 1 1 B 2 2 B 0 1 C 0 1 C 1 2 A 0 2 A 1 2 A 2

1条回答

网友

1楼 · 发布于 2024-05-19 01:13:35

您可以使用^{}by Series，它是由^{}通过^{}移位的concanate值创建的：

#use separator which is not in data like _ or ¥
s = df['ID'].astype(str) + '¥' + df['Class']
df['Counts'] = df.groupby(s.ne(s.shift()).cumsum()).cumcount()
print (df)
    ID Class  Counts
0    1     A       0
1    1     A       1
2    2     A       0
3    1     B       0
4    1     B       1
5    1     B       2
6    2     B       0
7    1     C       0
8    1     C       1
9    2     A       0
10   2     A       1
11   2     A       2

另一个带有^{}（pandas 0.20.2+）的解决方案：

s = df.groupby(['ID','Class']).ngroup()
df['Counts'] = df.groupby(s.ne(s.shift()).cumsum()).cumcount()
print (df)
    ID Class  Counts
0    1     A       0
1    1     A       1
2    2     A       0
3    1     B       0
4    1     B       1
5    1     B       2
6    2     B       0
7    1     C       0
8    1     C       1
9    2     A       0
10   2     A       1
11   2     A       2

相关问题更多 >

编程相关推荐

热门问题

热门文章

计算列的前置项并创建这些计数的新变量

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >