在pandas dataframe中查找最大值的索引和列名

3 投票

2 回答

3776 浏览

提问于 2025-04-17 16:16

我有一个包含五列五行的Python数据表（dataframe），我想找到最大三个值的行和列名称。

举个例子：

df = 

  A   B  C  D  E  F
1 00 01 02 03 04 05
2 06 07 08 09 10 11
3 12 13 14 15 16 17
4 18 19 20 21 22 23
5 24 25 26 27 28 29

输出结果可能会显示类似这样的内容：
[5,F],[5,E],[5,D]

2 个回答

我不会假装这是解决这个问题的最有效方法，但我觉得值得提一下：

df

    A   B   C   D   E   F
1   0   1   2   3   4   5
2   6   7   8   9  10  11
3  12  13  14  15  16  17
4  18  19  20  21  22  23
5  24  25  26  27  28  29

使用 df.max() 来获取每一列的最大值，然后对这些值进行排序，找出最大的数字。接着，将这些最大值与原始的 df 进行对比，返回对应的值。最后，可以使用列表推导式来获取这些值的索引：

df_2 = df[df.max().sort_values(ascending=True).tail(3).eq(df)]
[(i, df_2[i].first_valid_index()) for i in df_2.columns if df_2[i].first_valid_index() != None]

输出：

[('D', 5), ('E', 5), ('F', 5)]

或者

s = df_2.apply(pd.Series.first_valid_index).dropna()
list(zip(s.index, s.astype(int)))

输出：

[('D', 5), ('E', 5), ('F', 5)]

回答于 2025-04-17 由 Python大师

分享举报

你可以在排序之前使用 unstack：

>>> df
    A   B   C   D   E   F
1   0   1   2   3   4   5
2   6   7   8   9  10  11
3  12  13  14  15  16  17
4  18  19  20  21  22  23
5  24  25  26  27  28  29
>>> df.unstack()
A  1     0
   2     6
   3    12
   4    18
   5    24
B  1     1
   2     7
   3    13
   4    19
   5    25
[...]
F  1     5
   2    11
   3    17
   4    23
   5    29

还有其他方法

>>> df2 = df.unstack().copy()
>>> df2.sort()
>>> df2[-3:]
D  5    27
E  5    28
F  5    29
>>> df2[-3:].index
MultiIndex
[(D, 5.0), (E, 5.0), (F, 5.0)]

甚至可以这样做

>>> df.unstack()[df.unstack().argsort()].index[-3:]
MultiIndex
[(D, 5.0), (E, 5.0), (F, 5.0)]

[我没去反转顺序：在最后加上 [::-1] 就可以了。]

回答于 2025-04-17 由 Python大师

分享举报

在pandas dataframe中查找最大值的索引和列名

2 个回答

撰写回答