我用逻辑回归来估计在足球比赛中进球的概率。我有5个特点。我的目标值是1(目标)或0(无目标)
因为这一直是必须的,我在安装模型之前已经缩放了我的特征。我使用了MinMaxScaler,它可以按如下方式缩放[0-1]范围内的所有功能: X_标度=(X-X_最小值)/(X_最大值-X_最小值)
我的逻辑回归模型的系数如下:
coef = [[-2.26286643 4.05722387 0.74869811 0.20538172 -0.49969841]]
我的第一个想法是,第二个特征是最重要的,其次是第一个。这总是真的吗
我读到“换句话说,对于‘第二个特征’增加一个单位,对数优势的预期变化为4.05722387。”在this site上,但在那里,他们的特征用平均值50和一些标准偏差进行了标准化
如果不缩放特征,则模型的系数如下所示:
coef = [[-0.04743728 0.04394143 -0.00247654 0.23769469 -0.55051824]]
现在看来,第一个特征比第二个更重要。我在文献中读到关于我的主题,这确实是真的。所以这让我很困惑
我的问题是:
y = 1/(1 + exp(-fx))
和fx = intercept + feature1*coef1 + feature2*coef2 + ...
(所有特征均已缩放)是否正确李>
看看边际效应计算的几个版本。例如,请参见overview/discussion in a blogStata's exampleresources for R
解释取决于您计算的边际效应。当你谈论X的一个单位增加/减少概率或优势比等的变化时,你只需要考虑缩放
是的,只是特征x是按比例度量的
相关问题 更多 >
编程相关推荐