根据条件Pandas重置累计和

2条回答

网友

1楼 · 编辑于 2024-06-16 15:36:01

一种方法是下面的代码。但这是一个非常低效和不雅观的单行线。在

df1.groupby('customer').apply(lambda x: (x['spend'].cumsum() *(x['spend'].cumsum() > x['hurdle']).astype(int).shift(-1)).fillna(x['spend']))

网友

2楼 · 编辑于 2024-06-16 15:36:01

有更快捷的方法。这里有一个效率低下的apply方法是。在

In [3270]: def custcum(x):
      ...:     total = 0
      ...:     for i, v in x.iterrows():
      ...:         total += v.spend
      ...:         x.loc[i, 'cum'] = total
      ...:         if total >= v.hurdle:
      ...:            total = 0
      ...:     return x
      ...:

In [3271]: df.groupby('customer').apply(custcum)
Out[3271]:
  customer  spend  hurdle    cum
0        A     20      50   20.0
1        A     31      50   51.0
2        A     20      50   20.0
3        B     50     100   50.0
4        B     51     100  101.0
5        B     30     100   30.0

您可以考虑使用cython或numba来加速custcum

[更新]

Ido s答案的改进版本。在

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据条件Pandas重置累计和

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >