我有一个数字,每个人在一个特定的月份由一个整数表示。我需要为每一个人添加这些数字,直到每一行的指定日期。我想在python数据帧上使用apply函数使其具有可伸缩性
例如:
df = pd.DataFrame(
{'number': [10, 20 , 30, 40, 50], 'individual': ["John", "John" , "Eleonor", "Eleonor", "Eleonor"], 'date': [1, 2, 3, 4, 5]})
数据框=
number individual date
0 10 John 1
1 20 John 2
2 30 Eleonor 3
3 40 Eleonor 4
4 50 Eleonor 5
当日期严格小于行中的日期时,我想对这些数字求和,如果没有一行的日期满足条件,就用NA表示。 结果是:
number individual date
0 NA John 1
1 10 John 2
2 NA Eleonor 3
3 30 Eleonor 4
4 70 Eleonor 5
收益率
我找到了按要求使用apply方法的解决方案,该方法允许与dask一起使用:
这就产生了
相关问题 更多 >
编程相关推荐