多观测值的pymc3分层模型，在MCMC期间不计算可能性？

mallard = pd.read_csv('mallard.csv') elev, length, forest = mallard.elev, mallard.length, mallard.forest # transpose ys to have same shape as series of each covariate (elev, length...) observations = mallard[['y1','y2','y3']].T num_transects = len(mallard) with pm.Model() as mallard_model: # priors # detection probability considered constant across all transects and plots prob = pm.Beta('prob', alpha=1, beta=1) # priors for deterministic linear model of local abundance at a transect # that applies to all plots within a transect b0 = pm.Normal('b0', mu=0, sd=10) # intercept b1 = pm.Normal('b1', mu=0, sd=10) # elevation b2 = pm.Normal('b2', mu=0, sd=10) # forest cover b3 = pm.Normal('b3', mu=0, sd=10) # survey length # linear model of local abundance using log link lam = pm.Deterministic('lam', pm.math.exp(b0 + b1*elev + b2*forest + b3*length)) # likelihood of observations # Ni is abundance at a transect, with binomial distribution across # plots within a transect Ni = pm.Poisson('Ni', mu=lam, shape=num_transects) Y_obs = pm.Binomial('Y_obs', n=Ni, p=prob, observed=observations) # inference, use default step functions for each parameter trace = pm.sample(draws=5000, init='ADVI', n_init=10000)#, step=pm.Metropolis()) plt.figure(figsize=(7, 7)) pm.traceplot(trace[100:]) # leave out first 100 draws as burn-in plt.tight_layout()

2条回答

网友

1楼 · 编辑于 2024-05-19 22:26:58

我也有类似的问题，只是我的观察数据不是number of observationsxnumber of variables的格式。结果只使用了第一次观察。在

尝试observations = mallard[['y1','y2','y3']]

如果你想在以后的使用中取样sample_ppc

网友

2楼 · 编辑于 2024-05-19 22:26:58

我认为你的模型有几个问题：

离散参数不适用于advi和nuts，我怀疑metropolis采样器也能处理所有这些离散参数。在许多情况下，您可以将它们边缘化，但在这里，您可能希望使用一个连续变量来表示总体规模。也许是这样的（这也考虑到人口规模低于观察到的数量是不可能的）
```
sd = pm.HalfCauchy('Ni_sd', beta=2.5)
trafo = pm.distributions.transforms.lowerbound(observations.max(axis=0))
Ni = pm.Gamma('Ni', mu=lam, sd=sd, shape=num_transects,
              transform=trafo, testval=observations.max(axis=0) + 1)
```
我认为你的模型是无法确定的：你不能总是增加所有的人口规模和减少道具？我看不出这个模型怎么能学到什么有用的道具。这些信息从何而来？
为什么人口规模取决于调查长度？这不应该是影响力的支柱吗？还是一个区域？

相关问题更多 >

编程相关推荐

热门问题

热门文章