回归中的有序分类数据 - 问答 - Python中文网

回归中的有序分类数据

2024-05-14 16:11:11 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我有一个数据集，分类数据的权重是不同的，比如说博士的权重比硕士高，比如理学硕士比理学士高。在

我知道应该使用Label encoder，但我不希望python任意地为这些变量分配代码。我想要更高的代码，博士=4，理学硕士=3，理学学士=2，O等级=1，无学历=0。在

有什么我可以做的吗？有人能帮忙吗？在

Tags：数据代码 encoder 分类 label 权重博士学士

1条回答

网友

1楼 · 发布于 2024-05-14 16:11:11

LabelEncoder将根据字母顺序对类别进行编码，并存储在classes_属性中。默认情况下是这样：

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit(['Phd', 'Msc','Bsc', 'O Levels','No education'])
ll.classes_
# Output: array(['Bsc', 'Msc', 'No education', 'O Levels', 'Phd'], dtype='|S12')

有多少种类？如果更少，您可以自己使用dict进行转换，类似于this answer here：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章