列上的多索引从级别0（外部）和级别1（内部）中选择列

import pandas as pd df = pd.DataFrame({'dt':['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-03', '2020-01-01', '2020-01-02', '2020-01-03', '2020-01-03'], 'group':['a', 'a', 'b', 'b', 'a', 'a', 'b', 'b'], 'bar':[1,2,3, 4, 1,2,3, 4], 'baz':[3,4,5, 6, 3,4,5, 6]}) df = df.groupby(['dt', 'group']).describe()

3条回答

网友

1楼 · 编辑于 2024-04-27 02:48:28

不确定这是否是您想要的：

 #assigned outcome to a different variable
 res = df.groupby(['dt', 'group']).describe()

#create a slicer, makes it easier to slice the multiIndex
idx = pd.IndexSlice

res.loc[idx[:],idx['bar',['25%','50%','75%']]]

你可以用这个来达到同样的效果

res.loc(axis=1)['bar',['25%','50%','75%']]


                        bar
                25% 50% 75%
   dt   group           
2020-01-01  a   1.0 1.0 1.0
2020-01-02  a   2.0 2.0 2.0
2020-01-03  b   3.0 3.5 4.0

或横截面切片：

res.xs('bar',level=0,axis=1).filter(['25%','50%','75%'])

                25% 50% 75%
   dt   group           
2020-01-01  a   1.0 1.0 1.0
2020-01-02  a   2.0 2.0 2.0
2020-01-03  b   3.0 3.5 4.0

网友

2楼 · 编辑于 2024-04-27 02:48:28

I.e. I want to be able to select df[['dt', 'group', ('bar', '25%'), , ('bar', '25%'), , ('bar', '25%')]].

您可以执行以下操作：

df.reset_index()[[('dt', ""), ('group', ""), ('bar', '25%'), ('bar', '50%')]]

输出：

           dt group  bar     
                     25%  50%
0  2020-01-01     a  1.0  1.0
1  2020-01-02     a  2.0  2.0
2  2020-01-03     b  3.0  3.5

至于这个图，在我看来，你想画一个4维的图。。。（x->；dt，y->；数据帧值，色调->；对应于每个组，然后您有每个百分位列，例如('bar', '25%')，('bar', '50%')）。不清楚如何区分绘图中的('bar', '25%')和('bar', '50%')。也许您预计会有6个单独的图（3个百分位数*2列[bar，baz]），在这种情况下，这可能会有所帮助：

sns.lineplot(data=df.reset_index(), x="dt", y=("bar", '25%'), hue='group')

网友

3楼 · 编辑于 2024-04-27 02:48:28

只是另一种剥猫皮的方法：

print (df["bar"].filter(like="%"))

                  25%  50%  75%
dt         group               
2020-01-01 a      1.0  1.0  1.0
2020-01-02 a      2.0  2.0  2.0
2020-01-03 b      3.0  3.5  4.0

相关问题更多 >

编程相关推荐

热门问题

热门文章