将长格式面板数据重塑为宽堆叠时间序列

+--------+----------+------------+----------+ | | user_id | order_date | values | +--------+----------+------------+----------+ | 0 | 11039591 | 2017-01-01 | 3277.466 | | 1 | 25717549 | 2017-01-01 | 587.553 | | 2 | 13629086 | 2017-01-01 | 501.882 | | 3 | 3022981 | 2017-01-01 | 1352.546 | | 4 | 6084613 | 2017-01-01 | 441.151 | | ... | ... | ... | ... | | 186415 | 17955698 | 2020-05-01 | 146.868 | | 186416 | 17384133 | 2020-05-01 | 191.461 | | 186417 | 28593228 | 2020-05-01 | 207.201 | | 186418 | 29065953 | 2020-05-01 | 430.401 | | 186419 | 4470378 | 2020-05-01 | 87.086 | +--------+----------+------------+----------+

+----------+------------+------------+------------+------------+------------+ | | 2017-01-01 | 2017-01-02 | 2017-01-03 | 2017-01-04 | 2017-01-05 | +----------+------------+------------+------------+------------+------------+ | 11039591 | 3277.466 | 6482.722 | NaN | NaN | NaN | | 25717549 | 587.553 | NaN | NaN | NaN | NaN | | 13629086 | 501.882 | NaN | NaN | NaN | NaN | | 3022981 | 1352.546 | NaN | NaN | 557.728 | NaN | | 6084613 | 441.151 | NaN | NaN | NaN | NaN | +----------+------------+------------+------------+------------+------------+

def time_series_stacker(df): ts = list() for user in df['user_id'].unique(): values = df.loc[df['user_id']==user].drop('user_id', axis=1).T.values instance = pd.DataFrame( values[1,:].reshape(1,-1), index=[user], columns=values[0,:].astype('datetime64[ns]') ) ts.append(instance) return pd.concat(ts, axis=0)

1条回答

网友

1楼 · 发布于 2024-04-25 14:16:34

这是尝试pivot_table的最佳时机

    user_id  order_date    values
0  11039591  2017-01-01  3277.466
1  11039591  2017-01-02   587.553
2  13629086  2017-01-03   501.882
3  13629086  2017-01-02  1352.546
4   6084613  2017-01-01   441.151

df.pivot_table(index='user_id',columns='order_date',values='values')

输出

order_date  2017-01-01  2017-01-02  2017-01-03
user_id
6084613        441.151         NaN         NaN
11039591      3277.466     587.553         NaN
13629086           NaN    1352.546     501.882

相关问题更多 >

编程相关推荐

热门问题

热门文章