分割多层索引中的一级为列

2024-05-15 01:35:01 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我有一个数据框:

df = pd.DataFrame([["foo","fizz",1],["foo","fizz",2],["foo","buzz",3],["foo","buzz",4],["bar","fizz",6],["bar","buzz",8]],columns=["a","b","c"])

       a    b     c
    0  foo  fizz  1
    1  foo  fizz  2
    2  foo  buzz  3
    3  foo  buzz  4
    4  bar  fizz  6
    5  bar  buzz  8

我可以分组:

df2 = df.groupby(["a","b"]).sum()

              c
    a   b
    bar buzz  8
        fizz  6
    foo buzz  7
        fizz  3

太棒了!但我真正需要的,不是“c”列,而是两列,“foo”和“bar”:

          foo  bar
    b
    buzz  7    8
    fizz  3    6

有人能推荐一种方法吗?我试着搜索,但我想我没有正确的术语,所以我找不到任何东西。


Tags: columns数据方法dataframedffoobarpd
1条回答
网友
1楼 · 发布于 2024-05-15 01:35:01

您可以使用unstack来实现:

df2.unstack(level='a')

示例:

In [146]: df2.unstack(level='a')
Out[146]:
       c
a    bar foo
b
buzz   8   7
fizz   6   3

之后,您将得到多索引列。如果需要获取平面数据帧,可以使用多索引的droplevel

df3 = df2.unstack(level='a')
df3.columns = df3.columns.droplevel()

In [177]: df3
Out[177]:
a     bar  foo
b
buzz    8    7
fizz    6    3

编辑

droplevel从列在unstack之后变成的多索引中删除级别。默认情况下,它会降低级别0,这是您需要的数据帧。

help(pd.core.index.MultiIndex.droplevel)复制:

Help on function droplevel in module pandas.core.index:

droplevel(self, level=0) Return Index with requested level removed. If MultiIndex has only 2 levels, the result will be of Index type not MultiIndex.

Parameters
----------
level : int/level name or list thereof

Notes
-----
Does not check if result index is unique or not

Returns
-------
index : Index or MultiIndex

相关问题 更多 >

    热门问题