我无法在PythonStatsModels中获得线性回归来拟合具有负斜率的数据系列—RLM和OLS都不适合我。举一个非常简单的例子,我预计斜率为-1:
In [706]: ts12 = pandas.TimeSeries(data=[5,4,3,2,1],index=[1,2,3,4,5])
In [707]: ts12_h = sm.RLM(ts12.values, ts12.index, M=sm.robust.norms.HuberT())
In [708]: ts12_fit = ts12_h.fit()
In [710]: ts12_fit.fittedvalues
Out[710]: array([ 0.62321739, 1.24643478, 1.86965217, 2.49286956, 3.11608696])
In [729]: ts12_fit.params
Out[729]: array([ 0.62321739])
In [733]: ts12_ols = sm.OLS(ts12.values, ts12.index)
In [734]: ts12_ols_fit = ts12_ols.fit()
In [736]: ts12_ols_fit.fittedvalues
Out[736]: array([ 0.63636364, 1.27272727, 1.90909091, 2.54545455, 3.18181818])
RLM和OLS的拟合参数给出了0.6的斜率。。。拟合值反映了这一趋势。scipy的普通最小二乘回归给出了斜率为-1的预期结果:
^{pr2}$我一定漏掉了一些显而易见的东西,但通常的方法是什么也没发现。在
默认情况下,statsmodels不添加常量,除非使用公式接口。在
在本例中,您将强制回归线穿过零。在
编辑
OLS参数估计可以处理一个完美的拟合。在
RLM需要噪声等级估计。在完美拟合的情况下,方差为零,RLM不起作用。在
加上一点噪声RLM得到了基本相同的结果。在
^{pr2}$相关问题 更多 >
编程相关推荐