我是新堆栈溢出!如果这是一个愚蠢或令人困惑的问题,请提前道歉。在
我有一组右删失纵向数据(又名生存数据),其中包括工人的失败(辞职)时间、工作地点和月薪。我的目标是预测/模拟每个工人的失败时间。因此,考虑到在时间变化很小的情况下,风险率近似于失效的条件概率,我决定基于Cox比例风险模型来模拟每个工人的失效时间。以下是我的步骤:
4.1
我使用均匀分布来生成每个模拟日的随机概率,并且故障日是工人的第一个模拟日,其危险率大于生成的概率。我重复这个步骤n次迭代。但是,这个结果包含了大量的“nan”,因为一些工人没有任何比生成概率更大的危险率。因此,很难扼杀失败的时间。在
4.2
我简单地把个人危险率最高的模拟日视为每个工人的失败时间。然而,这种方法并不奏效,因为工人的个体危险率可能非常恒定且很小。在
我尝试过参数化模型,但计算时间过长,因为我的数据集非常大(超过80万行)
My question: is there any suggestion of simulating/predicting the failure time of each worker?
非常感谢!在
杰夫
目前没有回答
相关问题 更多 >
编程相关推荐