尺度特征的logistic回归系数解释

2024-05-23 13:39:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我用逻辑回归来估计在足球比赛中进球的概率。我有5个特点。我的目标值是1(目标)或0(无目标)

因为这一直是必须的,我在安装模型之前已经缩放了我的特征。我使用了MinMaxScaler,它可以按如下方式缩放[0-1]范围内的所有功能: X_标度=(X-X_最小值)/(X_最大值-X_最小值)

我的逻辑回归模型的系数如下:

coef = [[-2.26286643 4.05722387 0.74869811 0.20538172 -0.49969841]]

我的第一个想法是,第二个特征是最重要的,其次是第一个。这总是真的吗

我读到“换句话说,对于‘第二个特征’增加一个单位,对数优势的预期变化为4.05722387。”在this site上,但在那里,他们的特征用平均值50和一些标准偏差进行了标准化

如果不缩放特征,则模型的系数如下所示:

coef = [[-0.04743728 0.04394143 -0.00247654 0.23769469 -0.55051824]]

现在看来,第一个特征比第二个更重要。我在文献中读到关于我的主题,这确实是真的。所以这让我很困惑

我的问题是:

  • 我的哪些功能是最重要的,找到它的最佳方法是什么/为什么
  • 如何解释缩放系数的含义?例如,功能1中增加1米意味着什么?我能在MinMaxScaler中投入1米,看看结果如何,并将其用作“一分钟增加”吗
  • 最终概率将被计算为y = 1/(1 + exp(-fx))fx = intercept + feature1*coef1 + feature2*coef2 + ... (所有特征均已缩放)是否正确

Tags: 模型功能目标方式特征逻辑概率fx
1条回答
网友
1楼 · 发布于 2024-05-23 13:39:41

Which of my features is the most important and what/why is the best methodology to find it?

看看边际效应计算的几个版本。例如,请参见overview/discussion in a blogStata's exampleresources for R

How can I interprete the meaning of the scaled coefficients? E.g. what does an increase with 1 meter in feature 1 mean? Can I throw 1 meter in the MinMaxScaler, see what comes out and use that as 'the one inut increase'?

解释取决于您计算的边际效应。当你谈论X的一个单位增加/减少概率或优势比等的变化时,你只需要考虑缩放

Is it true that the final probability wil be computed as y = 1/(1 + exp(-fx)) with fx = intercept + feature1coef1 + feature2coef2 + ... (with all features scaled).

是的,只是特征x是按比例度量的

相关问题 更多 >