如何在分位数回归中找出不同分位数的系数是否显著不同?(SPSS或Python)

2024-06-16 13:33:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在研究某一职业的收入增长率在收入分配的不同部分是否存在显著差异,看看收入差距是否在显著扩大或缩小

量子模型

我已经在SPSS中执行了分位数回归(我对编码是新手,只掌握Python的基本知识,所以我需要您的帮助)。因变量为指数化收入,自变量为时间(本数据集中的季度)、人口统计组、职业细分。我还添加了每个假人与时间变量的交互项

因此(至少在我看来),该模型允许在三个层面上比较收入的变化:

  1. 属于某一人口群体或细分市场如何影响收入(例如,与数据录入工作相比:数据分析增加100欧元,数据科学增加200欧元)
  2. 随着时间的推移,每个不同类别/虚拟的影响如何变化(例如,与数据输入工作相比,作为数据科学家的积极影响增加了10%,现在增加了220欧元)
  3. 这些变化效应在收入分配的不同部分之间有何差异(例如,时间系数*数据科学家在90%Q中比在10%Q中大得多,这表明收入较高的数据科学家比收入较低的数据科学家在一段时间内的收入增长更大)

问题

我在SPSS上得到了这个分位数回归的结果,一个巨大的表格,上面有所有的系数及其显著性和置信区间

现在我想找出90%Q和10%Q之间的差异是否具有统计学意义,以便说明该行业的收入差距是否显著增加或减少。我想用Python而不是SPSS来实现这一点,我搜索了如何将数据切割成分位数,以及如何执行分位数回归。但是,我们应该如何测试90%Q和10%Q之间差异的显著性呢


Tags: 数据模型编码时间量子差异细分科学家
1条回答
网友
1楼 · 发布于 2024-06-16 13:33:11

我发现了一种测试回归系数是否显著不同的方法,50%规则使用标准化β权重及其95%置信区间(可通过偏差校正自举法估计;对于分位数回归,它们通常已经在输出中提供)。该规则基本上表明,如果两个样本均值的95%置信区间重叠小于50%,则存在显著差异(p=0.05)。如果重叠小于14%,显著性水平为p=0.01

这是我在Youtube视频中发现的方法:

https://www.youtube.com/watch?v=qKnpiGwNDMk

Youtube视频提到的那篇文章:

卡明,G.(2009)。肉眼推断:读取置信区间的重叠<《医学统计》,28(2),205-220

相关问题 更多 >