2024-04-29 07:04:09 发布
网友
我目前正在研究一个数据集,该数据集提供了一家大公司几年来员工的信息。信息包括员工当年是否辞职(每年为真或假)、他们所处的纳税等级以及他们的年龄。根据数据集,我绘出了戒烟人数与年龄的比例,以及戒烟人数与税收等级的比例。假设这些数字可以被认为是考虑到年龄的人退出的概率,以及考虑到税收等级的人退出的概率,我想找到一种方法来预测考虑到年龄和税收等级的人退出的概率
我不能使用我们的数据集,因为它太小,而且大多数组合都不会出现在其中(所以我只得到0%的所有结果)。有没有办法用某种模型来预测呢
一个直接而简单的方法是使用你从他们所处的年龄和税收等级中获得的百分比的平均值。缺点是你认为这两个变量是独立的,在决定雇员是否辞职时有相同的权重。p>
更好的方法是使用分类器,根据员工的纳税等级和年龄,对其离职概率进行更准确的预测。你可以从普通的分类器开始,比如随机森林
一个直接而简单的方法是使用你从他们所处的年龄和税收等级中获得的百分比的平均值。缺点是你认为这两个变量是独立的,在决定雇员是否辞职时有相同的权重。p>
更好的方法是使用分类器,根据员工的纳税等级和年龄,对其离职概率进行更准确的预测。你可以从普通的分类器开始,比如随机森林
相关问题 更多 >
编程相关推荐