Python中棘手的基线移动

id Date ppm pos_diff finalppm finalpos t t_cnt ex ex_cnt aa Q122 40 3 160 7 50 2 0 0 aa Q222 10 1 150 6 0 0 0 0 bb Q122 -10 -2 510 7 0 0 0 0 bb Q222 10 2 500 5 0 0 50 3 bb Q322 50 8 450 -3 0 0 0 0 bb Q422 50 3 400 -6 20 2 0 0

id Date ppm pos_diff finalppm finalpos t t_cnt ex ex_cnt final final_cnt aa Q122 40 3 160 7 50 2 0 0 110 5 aa Q222 10 1 150 6 0 0 0 0 100 4 bb Q122 -10 -2 510 7 0 0 0 0 510 7 bb Q222 10 2 500 5 0 0 50 3 550 8 bb Q322 50 8 450 -3 0 0 0 0 500 0 bb Q422 50 3 400 -6 20 2 0 0 430 -5

1条回答

网友

1楼 · 发布于 2024-06-02 06:21:35

逻辑遵循您前面的问题：

# Compute constant part for each row
df['final'] = - df['ppm'] - df['t'] + df['ex']

# Update first final value of each group
df['final'].update(
    df.drop_duplicates(['id'])
      .apply(lambda x: x['finalppm'] - x['t'] + x['ex'], axis=1)
)

# Cumulative sum
df['final'] = df.groupby('id')['final'].cumsum()

与final_cnt相同的逻辑：

df['final_cnt'] = - df['pos_diff'] - df['t_cnt'] + df['ex_cnt']

df['final_cnt'].update(
    df.drop_duplicates(['id'])
      .apply(lambda x: x['finalpos'] - x['t_cnt'] + x['ex_cnt'], axis=1)
)

df['final_cnt'] = df.groupby('id')['final_cnt'].cumsum()

输出：

>>> df[['id', 'Date', 'final', 'final_cnt']]
   id  Date  final  final_cnt
0  aa  Q122    110          5
1  aa  Q222    100          4
2  bb  Q122    510          7
3  bb  Q222    550          8
4  bb  Q322    500          0
5  bb  Q422    430         -5

相关问题更多 >

编程相关推荐

热门问题

热门文章