前后变量选择
variable的Python项目详细描述
变量.方法选择
向前(Y,X)
背面(Y,X)
此包执行正向和反向选择过程,以帮助选择要包含在OLS回归模型中的变量。
正向选择过程从一个方程开始,该方程不包含预测变量,只包含用户必须添加的常数为了确定要包含在方程中的第一个变量,选择与响应变量具有最高简单相关性的自变量,并将其包含在ols回归中。如果对自变量的p值的评估完成,并且如果证明该变量与零显著不同,则将其保留在方程中,并开始对第二个变量进行审查。为了识别第二个变量,根据之前ols回归的残差完成与剩余变量的相关性。选择与残差相关度最高的自变量作为第二个变量,包含在随后的ols回归中。如果证明第二个变量的p值从零开始显著,则保留第二个变量并开始搜索第三个变量。对于所有可用变量,此过程将继续。
反向选择过程从所有变量开始,包括一个必须由用户添加的常量,并在每次迭代中系统地删除t值最小的变量
要启动函数,用户必须指定目标变量(y)和独立变量(X)
这个包的输出是一个表,显示变量的求值顺序,以及用于求值要包含在模型中的变量的验证因子。用户应查看表格,并根据自己的偏好作出决定。
这个变量选择包是基于chatterjee,samprit和hadi,ali s(2012)中描述的过程开发的。实例回归分析(第5版)新泽西州霍博肯:John Wiley&Sons,Inc.