2024-04-23 08:51:51 发布
网友
我有一个数据集,分类数据的权重是不同的,比如说博士的权重比硕士高,比如理学硕士比理学士高。在
我知道应该使用Label encoder,但我不希望python任意地为这些变量分配代码。我想要更高的代码,博士=4,理学硕士=3,理学学士=2,O等级=1,无学历=0。在
有什么我可以做的吗?有人能帮忙吗?在
LabelEncoder将根据字母顺序对类别进行编码,并存储在classes_属性中。默认情况下是这样:
classes_
from sklearn.preprocessing import LabelEncoder le = LabelEncoder() le.fit(['Phd', 'Msc','Bsc', 'O Levels','No education']) ll.classes_ # Output: array(['Bsc', 'Msc', 'No education', 'O Levels', 'Phd'], dtype='|S12')
有多少种类?如果更少,您可以自己使用dict进行转换,类似于this answer here:
LabelEncoder将根据字母顺序对类别进行编码,并存储在
classes_
属性中。默认情况下是这样:有多少种类?如果更少,您可以自己使用dict进行转换,类似于this answer here:
^{pr2}$相关问题 更多 >
编程相关推荐