回归中的有序分类数据

2024-04-23 08:51:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据集,分类数据的权重是不同的,比如说博士的权重比硕士高,比如理学硕士比理学士高。在

我知道应该使用Label encoder,但我不希望python任意地为这些变量分配代码。我想要更高的代码,博士=4,理学硕士=3,理学学士=2,O等级=1,无学历=0。在

有什么我可以做的吗?有人能帮忙吗?在


Tags: 数据代码encoder分类label权重博士学士
1条回答
网友
1楼 · 发布于 2024-04-23 08:51:51

LabelEncoder将根据字母顺序对类别进行编码,并存储在classes_属性中。默认情况下是这样:

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit(['Phd', 'Msc','Bsc', 'O Levels','No education'])
ll.classes_
# Output: array(['Bsc', 'Msc', 'No education', 'O Levels', 'Phd'], dtype='|S12')

有多少种类?如果更少,您可以自己使用dict进行转换,类似于this answer here

^{pr2}$

相关问题 更多 >