本文利用支持向量机来解决一个回归问题,基于分类和连续相结合的几个特征对教师收入进行预测。例如,我有[白人、亚洲人、西班牙裔、黑人],#年的教龄和多年的教育。在
对于分类,我使用了sci工具包的预处理模块,并对4个种族进行了热编码。在这个例子中,对于一个白人教师来说,它看起来像是[1,0,0,0],因此我有一个数组{[1,0,0,0],[0,1,0,0],…[0,0,1,0],[1,0,0,0]}代表每一位教师的种族。我可以用种族与收入进行回归,即:
clf= SVR(C=1.0)
clf.fit(racearray, income)
我也可以使用数量特征进行回归。但是,我不知道如何将这些功能组合在一起
^{pr2}$
您可以使用scikit learn的OneHotEncoder。如果您的数据在numpy数组“racearray”中并且列是
您的代码应该类似(请记住numpy枚举以0开头)
然后您可以像往常一样查看您的
^{pr2}$race_encode
数组,并在SVR中使用它相关问题 更多 >
编程相关推荐