根据列表排序Pandas DataFrame

31 投票
1 回答
24624 浏览
提问于 2025-05-01 05:41

我想对下面这个数据表进行排序:

Region           LSE          North      South
0                   Cn     33.330367   9.178917
1               Develd     -36.157025 -27.669988
2               Wetnds    -38.480206 -46.089908
3                Oands    -47.986764 -32.324991
4               Otherg    323.209834  28.486310
5                 Soys      34.936147   4.072872
6                  Wht     0.983977 -14.972555

我希望按照这个列表来重新排列LSE这一列:

lst = ['Oands','Wetnds','Develd','Cn','Soys','Otherg','Wht']

当然,其他列也需要相应地重新排序。请问在pandas中有没有办法做到这一点?

暂无标签

1 个回答

36

在pandas 0.15版本中,对Categorical的支持得到了改善,这让你可以轻松地做到这一点:

df['LSE_cat'] = pd.Categorical(
    df['LSE'], 
    categories=['Oands','Wetnds','Develd','Cn','Soys','Otherg','Wht'], 
    ordered=True
)
df.sort('LSE_cat')
Out[5]: 
   Region     LSE       North      South LSE_cat
3       3   Oands  -47.986764 -32.324991   Oands
2       2  Wetnds  -38.480206 -46.089908  Wetnds
1       1  Develd  -36.157025 -27.669988  Develd
0       0      Cn   33.330367   9.178917      Cn
5       5    Soys   34.936147   4.072872    Soys
4       4  Otherg  323.209834  28.486310  Otherg
6       6     Wht    0.983977 -14.972555     Wht

如果这个排序只是暂时的,那么把LSE列保持为Categorical可能不是你想要的。但如果这个排序是你希望在不同场合多次使用的,那么Categoricals就是一个很好的解决方案。


在后来的pandas版本中,sort被替换成了sort_values,所以你需要使用:

df.sort_values('LSE_cat')

撰写回答