如何按索引值对数据帧的列进行排序

2024-05-23 19:18:53 发布

您现在位置:Python中文网/ 问答频道 /正文

是否有可能按特定索引的值对数据集的列进行排序?你知道吗

price / time           load_1 load_2 load_3 load_4
price                    50,    68,    23,    12
2018-01-01 00:00:00      12,    65,    37,     8
2018-01-01 00:15:00      13,    54,   112,     6
2018-01-01 00:30:00      58,     12,   96,     4

(第一个指数是能源消耗的价格,而下面几行代表能源的数量。列数未定义)

所以它基本上看起来像:

price / time           load_2 load_1 load_3 load_4
price                    68,    50,    23,    12
2018-01-01 00:00:00      65,    12,    37,     8
2018-01-01 00:15:00      54,    13,   112,     6
2018-01-01 00:30:00      12,    58,    96,     4

通过按价格指数按升序或降序对列进行排序。你知道吗


Tags: 数据数量time排序load代表价格指数
1条回答
网友
1楼 · 发布于 2024-05-23 19:18:53

如果索引名是price,则将^{}axis=1一起使用:

print (df.columns)
Index(['load_1', 'load_2', 'load_3', 'load_4'], dtype='object')

df = df.sort_values('price', axis=1, ascending=False)
print (df)
                     load_2  load_1  load_3  load_4
price / time                                       
price                    68      50      23      12
2018-01-01 00:00:00      65      12      37       8
2018-01-01 00:15:00      54      13     112       6
2018-01-01 00:30:00      12      58      96       4

如果列中的MultiIndex使用^{}

print (df.columns)
MultiIndex(levels=[['load_1', 'load_2', 'load_3', 'load_4'], ['12', '23', '50', '68']],
           labels=[[0, 1, 2, 3], [2, 3, 1, 0]],
           names=['price / time', 'price'])

df = df.sort_index(axis=1, level=1, ascending=False)
print (df)
price / time        load_2 load_1 load_3 load_4
price                   68     50     23     12
2018-01-01 00:00:00     65     12     37      8
2018-01-01 00:15:00     54     13    112      6
2018-01-01 00:30:00     12     58     96      4

此外,还需要将第二级转换为整数:

a = df.columns.get_level_values(0)
b = df.columns.get_level_values(1).astype(int)

df.columns = pd.MultiIndex.from_arrays([a,b], names=df.columns.names)

print (df.columns)
MultiIndex(levels=[['load_1', 'load_2', 'load_3', 'load_4'], [12, 23, 50, 68]],
           labels=[[0, 1, 2, 3], [2, 3, 1, 0]],
           names=['price / time', 'price'])

df = df.sort_index(axis=1, level=1, ascending=False)
print (df)
price / time        load_2 load_1 load_3 load_4
price                   68     50     23     12
2018-01-01 00:00:00     65     12     37      8
2018-01-01 00:15:00     54     13    112      6
2018-01-01 00:30:00     12     58     96      4

相关问题 更多 >