我有一个框架:
data=[[0,1,5],
[0,1,6],
[0,0,8],
[0,0,10],
[0,1,12],
[0,0,14],
[0,1,16],
[0,1,18],
[1,0,2],
[1,1,0],
[1,0,1],
[1,0,2]]
df = pd.DataFrame(data,columns=['KEY','COND','VAL'])
对于RES1,我想创建一个计数器变量RES,其中COND==1。的RES值 组的第一个键与VAL保持相同(我可以以某种方式使用cumcount())。你知道吗
对于RES2,我只想将缺少的值填充为
上一个值。(df.fillna(method='ffill'))
,我在想。。你知道吗
KEY COND VAL RES1 RES2
0 0 1 5 5 5
1 0 1 6 6 6
2 0 0 8 6
3 0 0 10 6
4 0 1 12 7 7
5 0 0 14 7
6 0 1 16 8 8
7 0 1 18 9 9
8 1 0 2 2 2
9 1 1 0 3 3
10 1 0 1 3
11 1 0 2 3
我们的目标是寻找一个矢量化的解决方案,它在超过百万行的情况下是最优的。你知道吗
IIUC公司
你想要:
相关问题 更多 >
编程相关推荐