使用ScikitLearn的SVR,如何结合分类和连续特征来预测目标?

2024-04-20 15:16:37 发布

您现在位置:Python中文网/ 问答频道 /正文

本文利用支持向量机来解决一个回归问题,基于分类和连续相结合的几个特征对教师收入进行预测。例如,我有[白人、亚洲人、西班牙裔、黑人],#年的教龄和多年的教育。在

对于分类,我使用了sci工具包的预处理模块,并对4个种族进行了热编码。在这个例子中,对于一个白人教师来说,它看起来像是[1,0,0,0],因此我有一个数组{[1,0,0,0],[0,1,0,0],…[0,0,1,0],[1,0,0,0]}代表每一位教师的种族。我可以用种族与收入进行回归,即:

clf= SVR(C=1.0)
clf.fit(racearray, income) 

我也可以使用数量特征进行回归。但是,我不知道如何将这些功能组合在一起

^{pr2}$

Tags: 模块利用编码工具包分类教师特征向量
1条回答
网友
1楼 · 发布于 2024-04-20 15:16:37

您可以使用scikit learn的OneHotEncoder。如果您的数据在numpy数组“racearray”中并且列是

[ contionus_feature1, contious_feature2, categorical, continous_feature3]

您的代码应该类似(请记住numpy枚举以0开头)

from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(categorical_features=[2])
race_encoded = enc.fit_transform(racearay)

然后您可以像往常一样查看您的race_encode数组,并在SVR中使用它

^{pr2}$

相关问题 更多 >