使用patsy和statsmodels的正确分段回归和冻结系数语法是什么?

2024-05-23 13:55:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图运行一个多元分段GLM,在同一个模型中,冻结一些系数,但显然我使用了错误的语法,因为结果不正确

以下是公式的一个示例:

pricing_1_formula = "pure_premium ~ I((channel_model == 'DIR')*1.1) + I((channel_model == 'IA')*1) + \
         I((channel_model == 'EA')*1) + I((credit_model_52778 ==1)*credit_model_52778) + \
         I((credit_model_52778 ==2)*credit_model_52778) + I((credit_model_52778 ==3)*credit_model_52778) +\
         I((credit_model_52778 >= 500)*credit_model_52778) + credit_model_52778"

要打破这一点,信用模型实际上包含分数和编码变量“1”、“2”和“3”是“不适用”的代码,因为信用评分不适用于该观察、无点击和精简文件。我希望他们根据模型浮动,然后在500开始的所有其他分数中拟合一条1度的线

我想保持通道的系数不变,这样来自“DIR”通道的任何观测值的系数都为1.1(对于GLM摘要为.1),对于通道为“IA”和“EA”的任何观测值,系数都为1

然而,“DIR”的系数返回为-29.1108。我不确定语法应该是什么


Tags: 模型model错误dir语法channel分数公式