如何设置和分组Pandas多级列？

PX_LAST PX_OPEN PX_CLOSE ticker source timestamp 0 1 2 3 A LSE 20180101 1 4 5 6 A LSE 20180102 1 7 8 9 B LSE 20180101 1 10 11 12 B LSE 20180102 ....

LSE LSE LSE LSE ... PX_LAST PX_LAST PX_CLOSE PX_CLOSE ... timestamp 20180101 1 7 2 8 ... 20180102 4 8 5 11 ...

3条回答

网友

1楼 · 编辑于 2024-06-16 15:01:01

您的解决方案应该有一点改变-使用set_index中列的顺序，省略第二个swaplevel并添加{a1}：

df = (df.set_index(['timestamp', 'source', 'ticker'])
        .unstack(level=[1,2])
        .swaplevel(0,2,axis=1)
        .sort_index(axis=1)
)
print (df)
ticker           A                        B                
source         LSE                      LSE                
          PX_CLOSE PX_LAST PX_OPEN PX_CLOSE PX_LAST PX_OPEN
timestamp                                                  
20180101         3       1       2        9       7       8
20180102         6       4       5       12      10      11

网友

2楼 · 编辑于 2024-06-16 15:01:01

一个选项是melt、set_index和unstack：

u = df.melt(['ticker', 'source', 'timestamp'])
(u.set_index(u.columns.difference({'value'}).tolist())['value']
  .unstack([1, 0, -1])
  .sort_index(axis=1))

ticker           A                        B                
source         LSE                      LSE                
variable  PX_CLOSE PX_LAST PX_OPEN PX_CLOSE PX_LAST PX_OPEN
timestamp                                                  
20180101         3       1       2        9       7       8
20180102         6       4       5       12      10      11

或melt，和pivot_table：

^{pr2}$

网友

3楼 · 编辑于 2024-06-16 15:01:01

我的建议是通过以下方式改变您的解决方案：

第一步：df.set_index(['timestamp', 'ticker', 'source']).unstack([1, 2])，就像你一样。在

它将列保留为以下形状：

          PX_LAST     PX_OPEN     PX_CLOSE
ticker          A   B       A   B        A   B
source        LSE LSE     LSE LSE      LSE LSE

（和timestamp作为索引）。在

第二步：reorder_levels([1, 2, 0], axis=1)，而不是你的2 swaplevel指令。在

它将列保留为：

^{pr2}$

最后一步是sort_index(axis=1, level=[0,1], sort_remaining=False)

请注意，您只对级别0和1进行排序，因此最后一个级别的顺序是保持不变（PX_LAST，PX_OPEN，PX_CLOSE）。在

所以整个脚本（即单个指令）是：

df2 = df.set_index(['timestamp', 'ticker', 'source']).unstack([1, 2])\
    .reorder_levels([1, 2, 0], axis=1)\
    .sort_index(axis=1, level=[0,1], sort_remaining=False)

打印结果时，您将得到：

^{4}$

相关问题更多 >

编程相关推荐

热门问题

热门文章