具有statsmod的线性回归问题

2024-04-19 10:34:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫df,看起来像这样:

   broker-value-current  broker-value-prior      consensus-after  
                 590.00              510.00              462.55   
                  32.74               31.98               30.72   
                  33.00               30.00               30.04 

           pctch_broker      pctch_consensus    pctch_frstrec_eps 
              15.686275             1.599051             1.421657   
               2.376485             0.195695           -82.098455   
              10.000000             0.805369           -82.098455  

      pctch_frstrec_rev  
               1.243782  
              -1.258936  
              -1.258936 

最后几列是用以下方法创建的:

^{pr2}$

我也用这句话来清除NA:

cleaned_data = data.dropna()

使用scipy stats时:

 import statsmodels.formula.api as sm

然而,当我试图将“pctch_consulty”或“pctch_broker”作为自变量,并将“pctch_frstrec_rev”或“pctch_frstrec_eps”作为因变量,用此代码回归:

 reg1 = sm.ols(formula="pctch_consensus ~ pctch_frstrec_rev", data=cleaned_data).fit()

我收到这个错误:

RuntimeWarning: invalid value encountered in greater return (S > tol).sum(axis=-1)

Tags: dfdatavaluerevbrokerepscurrentsm