如何获得大Pandas真实数据沿时间序列的均值/中位数?

2024-04-25 19:20:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我有房地产数据(每月房屋零售数据),我想得到每个地区的年度房屋销售沿时间序列。如何获得时间序列数据的平均值/中位数对我来说并不直观。有人告诉我怎么做吗?你知道吗

下面是我的时间序列数据的样子:

另外,我在这里与联机文件共享主机共享了示例数据集:example data snippet

数据描述

在这个房地产数据中,行是区域,列是月度房屋零售统计数据。我想得到这个房地产数据的年平均值/中位数。我怎样才能做到这一点?你知道吗? enter image description here

所需输出:

这是我想要得到的理想输出。你知道吗

region                              2012_mean 2012_median 2013_mean 2013_median

Chicago, IL metro area                  xxx     xxx         xxx         xxx
Chicago, IL                             xxx     xxx         xxx         xxx
Chicago, IL - Albany Park               xxx     xxx         xxx         xxx
Chicago, IL - Andersonville             xxx     xxx         xxx         xxx
Chicago, IL - Arcadia Terrace           xxx     xxx         xxx         xxx

Tags: 数据时间序列mean直观il地区xxx
1条回答
网友
1楼 · 发布于 2024-04-25 19:20:51

首先确保您的列是datetime对象,即do with groupby

df.columns=df.columns.str.strip()
df=df.set_index('Region')
s=df.T.groupby(df.columns.year).agg(['mean','median']).T.unstack()
s.columns=s.columns.map('_'.join)

相关问题 更多 >