套索回归是在Statsmodels中实现的吗?

2024-05-13 14:21:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我喜欢在statsmodels中使用线性套索回归,因此能够使用“公式”符号来编写模型,这将节省我在处理许多分类变量及其交互时的大量编码时间。然而,它似乎还没有在统计模型中实现?


Tags: 模型编码时间符号分类线性公式套索
2条回答

套索确实是在statsmodels中实现的。文档在以下url中提供:

http://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.fit_regularized.html

准确地说,statsmodel中的实现同时具有L1和L2正则化,它们的相对权重由L1_wt参数表示。你应该看看下面的公式,以确保你做的正是你想做的。

除了弹性网的实现外,statsmodels中还实现了平方根套索方法。

我们可以使用Patsy和scikit-learn来获得与statsmodels中的公式符号相同的结果。请参见下面的代码:

from patsy import dmatrices

# create dummy variables, and their interactions
y, X = dmatrices('outcome ~ C(var1)*C(var2)', df, return_type="dataframe")
# flatten y into a 1-D array so scikit-learn can understand it
y = np.ravel(y)

现在,我可以使用scikit learn中实现的任何模型,通常的符号是X作为自变量,y作为从属变量。

相关问题 更多 >