获取前一行的值并计算新列pandas python

>>> df ChangeEvent StartEvent case change open 0 Homeless Homeless 1 2014-03-08 00:00:00 2014-02-08 1 other Homeless 1 2014-04-08 00:00:00 2014-02-08 2 Homeless Homeless 1 2014-05-08 00:00:00 2014-02-08 3 Jail Homeless 1 2014-06-08 00:00:00 2014-02-08 4 Jail Jail 2 2014-06-08 00:00:00 2014-02-08

import pandas as pd import datetime as DT d = {'case' : pd.Series([1,1,1,1,2]), 'open' : pd.Series([DT.datetime(2014, 3, 2), DT.datetime(2014, 3, 2),DT.datetime(2014, 3, 2),DT.datetime(2014, 3, 2),DT.datetime(2014, 3, 2)]), 'change' : pd.Series([DT.datetime(2014, 3, 8), DT.datetime(2014, 4, 8),DT.datetime(2014, 5, 8),DT.datetime(2014, 6, 8),DT.datetime(2014, 6, 8)]), 'StartEvent' : pd.Series(['Homeless','Homeless','Homeless','Homeless','Jail']), 'ChangeEvent' : pd.Series(['Homeless','irrelivant','Homeless','Jail','Jail']), 'close' : pd.Series([DT.datetime(2015, 3, 2), DT.datetime(2015, 3, 2),DT.datetime(2015, 3, 2),DT.datetime(2015, 3, 2),DT.datetime(2015, 3, 2)])} df=pd.DataFrame(d)

1条回答

网友

1楼 · 发布于 2024-05-29 06:19:22

获取上一个的方法是使用shift方法：

In [11]: df1.change.shift(1)
Out[11]:
0          NaT
1   2014-03-08
2   2014-04-08
3   2014-05-08
4   2014-06-08
Name: change, dtype: datetime64[ns]

现在可以减去这些列。注意：这是0.13.1版本（datetime的东西最近做了很多工作，所以YMMV的版本比较旧）。

In [12]: df1.change.shift(1) - df1.change
Out[12]:
0        NaT
1   -31 days
2   -30 days
3   -31 days
4     0 days
Name: change, dtype: timedelta64[ns]

您可以将此应用于每个案例/组：

In [13]: df.groupby('case')['change'].apply(lambda x: x.shift(1) - x)
Out[13]:
0        NaT
1   -31 days
2   -30 days
3   -31 days
4        NaT
dtype: timedelta64[ns]

相关问题更多 >

编程相关推荐

热门问题

热门文章