与R不同的Statsmodels-Poisson-glm

library(mosaic) Data = fetchData('http://dl.dropbox.com/u/8649795/AT_Austria.csv') Model = glm(Data~Origin+Destination+Dij+offset(log(Offset)), family=poisson(link="log"), data = Data) cor = cor(Data$Data, Model$fitted, method = "pearson", use = "complete") rsquared = cor * cor rsquared

> Model = glm(Data~Origin+Destination+Dij+offset(log(Offset)), family=poisson(link="log"), data = Data) Warning messages: 1: glm.fit: fitted rates numerically 0 occurred 2: glm.fit: fitted rates numerically 0 occurred > cor = cor(Data$Data, Model$fitted, method = "pearson", use = "complete") > rsquared = cor * cor > rsquared [1] 0.9753279

import numpy as np import pandas as pd import statsmodels.formula.api as smf import statsmodels.api as sm from scipy.stats.stats import pearsonr Data= pd.DataFrame(pd.read_csv('http://dl.dropbox.com/u/8649795/AT_Austria.csv')) Model = smf.glm('Data~Origin+Destination+Dij', data=Data, offset=np.log(Data['Offset']), family=sm.families.Poisson(link=sm.families.links.log)).fit() cor = pearsonr(doubleConstrained.fittedvalues, Data["Data"])[0] print "R-squared for doubly-constrained model is: " + str(cor*cor)

1条回答

网友

1楼 · 发布于 2024-05-16 03:02:21

看起来GLM在statsmodels中有收敛问题。也可能在R中，但R只给出这些警告。

Warning messages:
1: glm.fit: fitted rates numerically 0 occurred 
2: glm.fit: fitted rates numerically 0 occurred

这可能意味着在Logit/Probit上下文中实现完美分离。我得考虑一下泊松模型。

R正在做一个更好的，如果微妙的工作，告诉你，你的装置可能有问题。例如，如果你看statsmodels中的拟合可能性，它是-1.12e27。这应该是一个线索，就在那里，有些东西是关闭的。

直接使用Poisson模型（在可能的情况下，我总是喜欢最大似然法而不是GLM），我可以复制R结果（但我得到了收敛警告）。很明显，同样，默认的牛顿-拉夫森解算器失败了，所以我使用BFG。

import numpy as np
import pandas as pd
import statsmodels.formula.api as smf
import statsmodels.api as sm
from scipy.stats.stats import pearsonr

data= pd.DataFrame(pd.read_csv('http://dl.dropbox.com/u/8649795/AT_Austria.csv'))

mod = smf.poisson('Data~Origin+Destination+Dij', data=data, offset=np.log(data['Offset'])).fit(method='bfgs')

print mod.mle_retvals['converged']

相关问题更多 >

编程相关推荐

热门问题

热门文章