pandas：对多层列数据框进行排序/重新排列列

Question

我有以下数据：

from pandas import Timestamp

values = [['IDX100', 'field1', Timestamp('1999-02-01 05:00:00'), '101'],
       ['IDX100', 'field1', Timestamp('1999-02-02 05:00:00'), '102'],
       ['IDX100', 'field1', Timestamp('1999-02-03 05:00:00'), '103'],
       ['IDX200', 'field1', Timestamp('1999-02-01 05:00:00'), '601'],
       ['IDX200', 'field1', Timestamp('1999-02-02 05:00:00'), '602'],
       ['IDX200', 'field1', Timestamp('1999-02-03 05:00:00'), '603'],
       ['IDX100', 'field2', Timestamp('1999-02-01 05:00:00'), '201'],
       ['IDX100', 'field2', Timestamp('1999-02-02 05:00:00'), '202'],
       ['IDX100', 'field2', Timestamp('1999-02-03 05:00:00'), '203'],
       ['IDX200', 'field2', Timestamp('1999-02-01 05:00:00'), '701'],
       ['IDX200', 'field2', Timestamp('1999-02-02 05:00:00'), '702'],
       ['IDX200', 'field2', Timestamp('1999-02-03 05:00:00'), '703'],
       ['IDX100', 'field3', Timestamp('1999-02-01 05:00:00'), '301'],
       ['IDX100', 'field3', Timestamp('1999-02-02 05:00:00'), '302'],
       ['IDX100', 'field3', Timestamp('1999-02-03 05:00:00'), '303'],
       ['IDX200', 'field3', Timestamp('1999-02-01 05:00:00'), '801'],
       ['IDX200', 'field3', Timestamp('1999-02-02 05:00:00'), '802'],
       ['IDX200', 'field3', Timestamp('1999-02-03 05:00:00'), '803']]

df = pd.DataFrame(values, columns = ['identifier', 'code', 'date', 'value'])

在对我的数据表进行透视后，我得到了以下结果：

df = df.pivot(index=['date'], columns=['identifier', 'code'], values=['value'])

                     value                                   
identifier          IDX100 IDX200 IDX100 IDX200 IDX100 IDX200
code                field1 field1 field2 field2 field3 field3
date                                                         
1999-02-01 05:00:00    101    601    201    701    301    801
1999-02-02 05:00:00    102    602    202    702    302    802
1999-02-03 05:00:00    103    603    203    703    303    803

不过，我希望输出的结果看起来像这样：

identifier           IDX100                IDX200 
code                 field3 field2 field1  field3 field2 field1
date                                                         
1999-02-01 05:00:00    301    201    101   801    701    601
1999-02-02 05:00:00    302    202    102   802    702    602
1999-02-03 05:00:00    303    203    103   803    703    603

我可以通过做一些类似的操作接近这个结果：

df = df.reindex(sorted(df.columns), axis=1)

但是这样做会保持level2列的顺序为field1、field2、field3。我希望能够以不同的顺序来排列这些字段……最好是根据我提供的一个列表来排序。例如，我可能想要的顺序是field3、field2、field1，或者field2、field1、field3。

有没有人能帮我解决这个问题？

数据处理数据框多层列列排序透视表数据重排列自定义顺序

pandas：对多层列数据框进行排序/重新排列列

2 个回答

撰写回答