我有一个数据集,其中包含我需要在粗略的时间间隔内聚合的单个观察值,作为每个时间间隔内几个指标变量的函数。我假设这里的解决方案是执行groupby
操作,然后进行重采样:
adult_resampled = adult_data.set_index('culture', drop=False).groupby(['over64','regioneast','pneumo7',
'pneumo13','pneumo23','pneumononPCV','PENR','LEVR',
'ERYTHR','PENS','LEVS','ERYTHS'])['culture'].resample('AS', how='count')
结果是一个看起来很尴尬的序列,有大量的层次索引,所以也许这不是正确的方法,但是我需要将层次索引转换为列。我现在唯一能做的就是破解层次索引(通过拉出索引标签,它本质上就是我需要的列的内容)。你知道吗
任何关于我应该做什么的建议都将不胜感激!你知道吗
我尝试了新的Grouper
语法,但它不允许我随后将层次索引更改为数据列。将unstack
应用于此表:
结果如下:
为了使这个数据集有用,比如在回归模型中,我真的需要索引标签作为列中的指标。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐