我似乎找不到任何做多元回归的python库。我只发现简单的回归。我需要将因变量(y)与几个自变量(x1、x2、x3等)进行回归。
例如,使用此数据:
print 'y x1 x2 x3 x4 x5 x6 x7'
for t in texts:
print "{:>7.1f}{:>10.2f}{:>9.2f}{:>9.2f}{:>10.2f}{:>7.2f}{:>7.2f}{:>9.2f}" /
.format(t.y,t.x1,t.x2,t.x3,t.x4,t.x5,t.x6,t.x7)
(以上输出:)
y x1 x2 x3 x4 x5 x6 x7
-6.0 -4.95 -5.87 -0.76 14.73 4.02 0.20 0.45
-5.0 -4.55 -4.52 -0.71 13.74 4.47 0.16 0.50
-10.0 -10.96 -11.64 -0.98 15.49 4.18 0.19 0.53
-5.0 -1.08 -3.36 0.75 24.72 4.96 0.16 0.60
-8.0 -6.52 -7.45 -0.86 16.59 4.29 0.10 0.48
-3.0 -0.81 -2.36 -0.50 22.44 4.81 0.15 0.53
-6.0 -7.01 -7.33 -0.33 13.93 4.32 0.21 0.50
-8.0 -4.46 -7.65 -0.94 11.40 4.43 0.16 0.49
-8.0 -11.54 -10.03 -1.03 18.18 4.28 0.21 0.55
我将如何在python中对它们进行回归,以得到线性回归公式:
Y = a1x1 + a2x2 + a3x3 + a4x4 + a5x5 + a6x6 + +a7x7 + c
^{} 将执行以下操作:
那么
clf.coef_
将具有回归系数。^{} 也有类似的接口来对回归进行各种正则化。
这是我创作的一个小作品。我用R检查了一下,结果是正确的。
结果:
输出:
pandas
提供了一种运行OLS的方便方法,如下面的答案所示:Run an OLS regression with Pandas Data Frame
为了澄清,您给出的示例是多元线性回归,而不是多元线性回归参考。Difference:
简而言之:
(另一个source。)
相关问题 更多 >
编程相关推荐