我想在管道中使用sklearn OrdinalEncoder,同时确保对类别进行正确排序。我该怎么做
例如,我想将“教育水平”和“收入类别”的特征编码如下:
"Education_Level": {
"Uneducated": 1,
"High School": 2,
"College": 3,
"Graduate": 4,
"Post-Graduate": 5,
"Doctorate": 6
},
"Income_Category": {
"Less than $40K": 1,
"$40K - $60K": 2,
"$60K - $80K": 3,
"$80K - $120K": 4,
"$120K +": 5
}
有人能帮我怎么做吗?我提醒您,我想在管道中使用OrdinalEncoder
来执行任务。我可以用replace()
手动完成,但是因为我正在创建一个管道,所以我需要编码器对象(至少我想是这样)
您可以在初始化期间指定}参数。这将确保您的类别具有正确的顺序
OrdinalEncoder
{您可以执行以下操作:
该变压器将返回以下输出:
编辑:如果您想将输出作为一个文件
DataFrame
,最简单的方法是按如下方式重新创建它:相关问题 更多 >
编程相关推荐