根据列表排序Pandas DataFrame
我想对下面这个数据表进行排序:
Region LSE North South
0 Cn 33.330367 9.178917
1 Develd -36.157025 -27.669988
2 Wetnds -38.480206 -46.089908
3 Oands -47.986764 -32.324991
4 Otherg 323.209834 28.486310
5 Soys 34.936147 4.072872
6 Wht 0.983977 -14.972555
我希望按照这个列表来重新排列LSE这一列:
lst = ['Oands','Wetnds','Develd','Cn','Soys','Otherg','Wht']
当然,其他列也需要相应地重新排序。请问在pandas中有没有办法做到这一点?
1 个回答
36
在pandas 0.15版本中,对Categorical
的支持得到了改善,这让你可以轻松地做到这一点:
df['LSE_cat'] = pd.Categorical(
df['LSE'],
categories=['Oands','Wetnds','Develd','Cn','Soys','Otherg','Wht'],
ordered=True
)
df.sort('LSE_cat')
Out[5]:
Region LSE North South LSE_cat
3 3 Oands -47.986764 -32.324991 Oands
2 2 Wetnds -38.480206 -46.089908 Wetnds
1 1 Develd -36.157025 -27.669988 Develd
0 0 Cn 33.330367 9.178917 Cn
5 5 Soys 34.936147 4.072872 Soys
4 4 Otherg 323.209834 28.486310 Otherg
6 6 Wht 0.983977 -14.972555 Wht
如果这个排序只是暂时的,那么把LSE列保持为Categorical
可能不是你想要的。但如果这个排序是你希望在不同场合多次使用的,那么Categoricals
就是一个很好的解决方案。
在后来的pandas
版本中,sort
被替换成了sort_values
,所以你需要使用:
df.sort_values('LSE_cat')