用什么做多重相关?

2024-04-25 13:06:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图使用python计算一个响应数组和一组预测器数组之间的多重线性回归和多重相关性。 我看到了一个非常简单的例子来计算多元线性回归,这很简单。 但是如何用statsmodels计算多重相关性呢?或者其他的,作为替代。我想我可以使用rpy和R,但如果可能的话,我更愿意呆在python中。

编辑[澄清]: 考虑到这里描述的情况:http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704-EP713_MultivariableMethods/ 除了回归系数和其他回归参数外,我还想计算预测因子的多重相关系数


Tags: http编辑情况线性数组例子edustatsmodels
1条回答
网友
1楼 · 发布于 2024-04-25 13:06:01

你当然可以用斯塔茨模型和熊猫来做。像这样的事情可能会让你开始

import pandas
import statsmodels.api as sm
from statsmodels.formula.api import ols

data = pandas.DataFrame([["A", 4, 0, 1, 27], 
                         ["B", 7, 1, 1, 29], 
                         ["C", 6, 1, 0, 23], 
                         ["D", 2, 0, 0, 20], 
                         ["etc.", 3, 0, 1, 21]], 
                         columns=["ID", "score", "male", "age20", "BMI"])
print data.corr()

model = ols("BMI ~ score + male + age20", data=data).fit()
print model.params
print model.summary()

查看文档:

http://statsmodels.sourceforge.net/devel/

http://pandas.pydata.org/

编辑:我不熟悉术语多重相关系数,但我相信这只是多元回归模型R平方的平方根,不是吗?

print model.rsquared**.5
print model.rsquared_adj**.5

这就是你要找的吗?

相关问题 更多 >