Logistic回归中如何确定列匹配的一种热编码方法

2024-04-25 13:20:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我面临着一些问题,在逻辑回归与一个热编码。你知道吗

这是我的设想。你知道吗

我有一个分类功能的火车数据和编码使用一个热编码。你知道吗

   Limit        Color       Output (Predicted Output)
   4            Red         1
   2            Blue        0
   6            Yellow      1

在对颜色特性使用了一个热编码之后,我有了另外两个特性(如预期的那样),比如

Limit       Color_Red   Color_Blue  Color_Yellow    Output
4               1           0            0            1
2               0           1            0            0 
6               0           0            1            1

我已经建立了模型,并使用Logistic回归进行了评估和评分,它工作正常。你知道吗

现在我想用下面的结构来预测用户输入数据。你知道吗

Limit       Color   
6           Red 

把一个热编码转换成颜色特征,我得到了这个结构。你知道吗

Limit       Color_Red   
6             1

当我打电话的时候模型预测通过传递这个输入数据我得到下面的错误。。你知道吗

X has 2 features per sample; expecting 4 当然,输入数据特征数与模型输入特征数不匹配。你知道吗

如何修复,感谢您的帮助。你知道吗

问候
阿卜杜勒


Tags: 数据模型编码output颜色bluered特征