如何比较python中的分层回归模型？

Model 1: sales ~ adverts Model 2: sales ~ adverts + airplay + attract Res.Df RSS Df Sum of Sq F Pr(>F) 1 198 862264 2 196 434575 2 427690 96.447 < 2.2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 >

2条回答

网友

1楼 · 编辑于 2024-05-12 21:49:34

我不知道有哪一个函数可以像R中的示例那样直接比较两个模型，但是Scikit-Learn包是数据科学和机器学习中非常常用的Python包。它支持与回归模型相关的各种度量，这将允许您创建自己的比较

例如，它支持R²度量。以下示例来自Scikit的documentation on R²：

>>> from sklearn.metrics import r2_score
>>> y_true = [3, -0.5, 2, 7]
>>> y_pred = [2.5, 0.0, 2, 8]
>>> r2_score(y_true, y_pred)
0.948...
>>> y_true = [[0.5, 1], [-1, 1], [7, -6]]
>>> y_pred = [[0, 2], [-1, 2], [8, -5]]
>>> r2_score(y_true, y_pred,
...          multioutput='variance_weighted')
0.938...
>>> y_true = [1, 2, 3]
>>> y_pred = [1, 2, 3]
>>> r2_score(y_true, y_pred)
1.0
>>> y_true = [1, 2, 3]
>>> y_pred = [2, 2, 2]
>>> r2_score(y_true, y_pred)
0.0
>>> y_true = [1, 2, 3]
>>> y_pred = [3, 2, 1]
>>> r2_score(y_true, y_pred)
-3.0

通过对两个模型进行此操作，您可以得到与从R

网友

2楼 · 编辑于 2024-05-12 21:49:34

在方差分析中，您基本上计算RSS中的差异。您可以在vignette for ANOVA in statsmodels下查看更多信息：

import pandas as pd
import seaborn as sns
import numpy as np

iris = sns.load_dataset('iris')

from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm

iris.head()

    sepal_length    sepal_width petal_length    petal_width species
0   5.1 3.5 1.4 0.2 setosa
1   4.9 3.0 1.4 0.2 setosa
2   4.7 3.2 1.3 0.2 setosa
3   4.6 3.1 1.5 0.2 setosa
4   5.0 3.6 1.4 0.2 setosa

我们运行两个模型并进行方差分析：

full_lm = ols("sepal_length ~ petal_length+petal_width", data=iris).fit()
reduced_lm = ols("sepal_length ~ petal_length", data=iris).fit()
anova_lm(reduced_lm,full_lm)

    df_resid    ssr df_diff ss_diff F   Pr(>F)
0   148.0   24.525034   0.0 NaN NaN NaN
1   147.0   23.880694   1.0 0.64434 3.9663  0.048272

它抛出了一些警告（你可以在我上面链接的网站上看到），因为对于第一行，它无法计算F等

注意，这与另一个答案中建议的Rsquare计算不同。需要注意的一个重要问题是，如果包含更多的项，理论上的R平方会增加，你想看看这些项是否能显著解释额外的方差，这就是为什么你要使用方差分析

相关问题更多 >

编程相关推荐

热门问题

热门文章