Statsmodels OLS聚集标准错误(不接受来自DF的系列?)

2024-06-12 03:03:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在运行一个分析,可以从BEA区域的聚类中获益。我以前没有在Statsmodels中使用集群标准错误选项,所以我不清楚我是不是搞错了语法,还是该选项被破坏了。任何帮助都将不胜感激。在

下面是代码的相关部分(请注意,topline_specsdict返回Patsy样式的公式):

#Capture topline specs
topline_specs={'GO':spec_dict['PC_GO']['Total']['TYPE']['BOTH'],
               'RV':spec_dict['PC_RV']['Total']['TYPE']['BOTH'],
               'ISSUER':spec_dict['PROP']['ISSUER']['TYPE']['BOTH'],
               'PURPOSE':spec_dict['PROP']['PURPOSE']['TYPE']['BOTH']}

#Estimate each model
topline_mods={'GO':smf.ols(formula=topline_specs['GO'],data=data_d).fit(cov_type='cluster',
                                                                       cov_kwds={'groups':data_d['BEA_INT']})}

topline_mods['GO']

回溯源于一个numpy调用。它返回以下值:

^{pr2}$

我所能找到的关于使用聚集标准错误的所有内容看起来都像cov_kwds参数可以从包含模型数据的数据帧中获取一系列。我错过了什么?在


Tags: godata标准type选项错误covdict
1条回答
网友
1楼 · 发布于 2024-06-12 03:03:12

当使用公式创建模型时,丢失值处理默认为“drop”,并且从给定给模型的所有数据数组(__init__)中删除缺少观察值的行。在非公式接口中,当前默认值是忽略缺少的值。在

但是,在稍后给出的数组中,当前没有检查和自动删除丢失的值,在本例中,cov_kwds中需要的数据。如果这是一组原始的观测值,但是有些观测值在因变量和解释变量中被删除,那么就会出现长度不匹配,并且会引发报告的异常。在

我重新打开了https://github.com/statsmodels/statsmodels/issues/1220,因为在通过pandas索引获得足够信息的特殊情况下,可以处理丢失的值。在

相关问题 更多 >