如果前一列中的值不同，是否生成一个增加的计数器？

df['subcat_counter'] = 1 for i in range(1,len(df)): if df.sc_id[i-1]==df.sc_id[i] and df['user_id'][i-1]==df['user_id'][i]: df.at[i,'subcat_counter']=df.subcat_counter[i-1] else: df.at[i,'subcat_counter']=df.subcat_counter[i-1]+1

2条回答

网友

1楼 · 编辑于 2024-04-25 20:47:13

如果您关心的只是前一行，那么可以使用.shift()获取其值，然后进行相应的比较。在这里，我们检查user_id和sc_id是否与前一行匹配，并对其求反，以找到希望值更改的点。然后我们将它转换成int，使真值为1，假值为0（这不是严格必要的，但有助于解释发生了什么），然后进行累积求和。你知道吗

prev_row = df.shift(1)

df['subcat_counter'] = (
    ~(df['user_id'].eq(prev_row['user_id']) & df['sc_id'].eq(prev_row['sc_id']))
).astype(int).cumsum()

网友

2楼 · 编辑于 2024-04-25 20:47:13

使用^{}：

df1 = df[['user_id','sc_id']].ne(df[['user_id','sc_id']].shift()).cumsum().add_prefix('g_')

df['subcat_counter'] = df.join(df1).groupby(['g_user_id','g_sc_id'], sort=False).ngroup() + 1
print (df)
   user_id  sc_id  subcat_counter
0        1    100               1
1        1    100               1
2        1    101               2
3        1    100               3
4        2    100               4
5        2    105               5
6        3    105               6
7        3    105               6

另一种解决方案：

s = df['user_id'].astype(str) + '_' + df['sc_id'].astype(str) 
df['subcat_counter'] = s.ne(s.shift()).cumsum()
print (df)

   user_id  sc_id  subcat_counter
0        1    100               1
1        1    100               1
2        1    101               2
3        1    100               3
4        2    100               4
5        2    105               5
6        3    105               6
7        3    105               6

相关问题更多 >

编程相关推荐

热门问题

热门文章

如果前一列中的值不同，是否生成一个增加的计数器？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >