我有一个数据帧,比如:
customer spend hurdle
A 20 50
A 31 50
A 20 50
B 50 100
B 51 100
B 30 100
我想计算累计的附加列,当累计总和大于或等于以下障碍时,将基于同一客户重置:
^{pr2}$我在pandas中使用了cumsum
和{
以下是我当前使用的代码:
df1['cum_sum'] = df1.groupby(['customer'])['spend'].apply(lambda x: x.cumsum())
我知道这只是一个正常的累积总和。非常感谢你的帮助。在
一种方法是下面的代码。但这是一个非常低效和不雅观的单行线。在
有更快捷的方法。这里有一个效率低下的
apply
方法是。在您可以考虑使用
cython
或numba
来加速custcum
[更新]
Ido s答案的改进版本。在
^{pr2}$相关问题 更多 >
编程相关推荐