转弯DataFrameGroupBy.resample文件列的层次索引

2024-05-15 20:48:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据集,其中包含我需要在粗略的时间间隔内聚合的单个观察值,作为每个时间间隔内几个指标变量的函数。我假设这里的解决方案是执行groupby操作,然后进行重采样:

adult_resampled = adult_data.set_index('culture', drop=False).groupby(['over64','regioneast','pneumo7',
            'pneumo13','pneumo23','pneumononPCV','PENR','LEVR',
            'ERYTHR','PENS','LEVS','ERYTHS'])['culture'].resample('AS', how='count')

结果是一个看起来很尴尬的序列,有大量的层次索引,所以也许这不是正确的方法,但是我需要将层次索引转换为列。我现在唯一能做的就是破解层次索引(通过拉出索引标签,它本质上就是我需要的列的内容)。你知道吗

hack

任何关于我应该做什么的建议都将不胜感激!你知道吗

我尝试了新的Grouper语法,但它不允许我随后将层次索引更改为数据列。将unstack应用于此表:

Grouper

结果如下:

bad unstack

为了使这个数据集有用,比如在回归模型中,我真的需要索引标签作为列中的指标。你知道吗


Tags: 数据函数dataindex间隔时间标签解决方案