我有一个测试数据集和训练数据集如下。我提供了一个min records的样本数据,但是我的数据有1000多条记录。这是我需要用算法预测的目标变量。它只有四个类别,如1,2,3,4。它只能接受这些值中的任何一个。
培训数据集:
A B C D E
1 20 30 1 1
2 22 12 33 2
3 45 65 77 3
12 43 55 65 4
11 25 30 1 1
22 23 19 31 2
31 41 11 70 3
1 48 23 60 4
测试数据集:
A B C D E
11 21 12 11
1 2 3 4
5 6 7 8
99 87 65 34
11 21 24 12
由于E只有4类,我想用多项式Logistic回归(1vs Rest逻辑)来预测。我正在尝试使用python实现它。
我知道我们需要在变量中设置这些目标并使用算法预测这些值的逻辑:
output = [1,2,3,4]
但是我在如何使用python(sklearn)循环遍历这些值以及应该使用什么算法来预测输出值的问题上陷入了困境?任何帮助都将不胜感激
你可以试试
^{} 可以直接处理多个类。
相关问题 更多 >
编程相关推荐