Statsmodel多元线性回归误差Python

2024-05-15 00:13:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我运行(我认为是)相当直接的多元线性回归模型拟合使用统计模型。

我的代码如下:

y = 'EXITS|20:00:00'
all_columns = "+".join(y_2015piv.columns - ['EXITS|20:00:00'])
reg_formula = "y~" + all_columns

lm= smf.ols(formula=reg_formula, data=y_2015piv).fit()

因为我有大约30个因子变量,所以我正在使用Python字符串操作创建公式。”如上图所示。所有_列都是不带“y”的dataframe y_2015piv列。

这是所有的列:

DAY_Fri+DAY_Mon+DAY_Sat+DAY_Sun+DAY_Thu+DAY_Tue+DAY_Wed+ENTRIES|00:00:00+ENTRIES|04:00:00+ENTRIES|08:00:00+ENTRIES|12:00:00+ENTRIES|16:00:00+ENTRIES|20:00:00+EXITS|00:00:00+EXITS|04:00:00+EXITS|08:00:00+EXITS|12:00:00+EXITS|16:00:00+MONTH_Apr+MONTH_Aug+MONTH_Dec+MONTH_Feb+MONTH_Jan+MONTH_Jul+MONTH_Jun+MONTH_Mar+MONTH_May+MONTH_Nov+MONTH_Oct+MONTH_Sep

数据帧中的值是连续的数值变量和0/1虚拟变量。

当我尝试拟合模型时,会出现以下错误:

PatsyError: numbers besides '0' and '1' are only allowed with **
    y~DAY_Fri+DAY_Mon+DAY_Sat+DAY_Sun+DAY_Thu+DAY_Tue+DAY_Wed+ENTRIES|00:00:00+ENTRIES|04:00:00+ENTRIES|08:00:00+ENTRIES|12:00:00+ENTRIES|16:00:00+ENTRIES|20:00:00+EXITS|00:00:00+EXITS|04:00:00+EXITS|08:00:00+EXITS|12:00:00+EXITS|16:00:00+MONTH_Apr+MONTH_Aug+MONTH_Dec+MONTH_Feb+MONTH_Jan+MONTH_Jul+MONTH_Jun+MONTH_Mar+MONTH_May+MONTH_Nov+MONTH_Oct+MONTH_Sep

网上没有任何东西能说明这可能是什么。感谢任何帮助。

顺便说一下,当我把这个模型放在Scikit中时,就知道它工作得很好。所以我认为数据是正确的。

提前谢谢。


Tags: columns模型allregsatentriessunday

热门问题