如何在已知参数时从自定义分布中抽样？

import pymc3 as pm import numpy as np import scipy.stats as stats import pandas as pd import theano.tensor as tt with pm.Model() as model1: p=0.3 density = pm.DensityDist('density', lambda x1: tt.switch( x1, tt.log(p), tt.log(1 - p) ), ) #tt.switch( x1, tt.log(p), tt.log(1 - p) ) is the log likelihood from pymc3 source code with model1: step = pm.Metropolis() samples = pm.sample(1000, step=step)

1条回答

网友

1楼 · 发布于 2024-05-19 19:28:56

先前的预测性采样（应该使用pm.sample_prior_predictive()）只涉及使用计算图中RandomVariable对象提供的rng。默认情况下，DensityDist不实现RNG，但为此提供了random参数，因此需要使用该参数。对数似然度仅根据可观测值进行评估，因此它在这里不起作用。你知道吗

为任意分布生成有效RNG的一种简单方法是使用inverse transform sampling。在这种情况下，我们对单位区间上的均匀分布进行采样，然后通过所需函数的逆CDF进行变换。对于Bernoulli情形，逆CDF基于成功概率划分单元线，将0分配给一个部分，将1分配给另一个部分。你知道吗

这里是一个类似工厂的实现，它创建了一个与pm.DensityDist的random参数兼容的Bernoulli RNG（即，接受point和sizekwargs）。你知道吗

def get_bernoulli_rng(p=0.5):

    def _rng(point=None, size=1):
        # Bernoulli inverse CDF, given p (prob of success)
        _icdf = lambda q: np.uint8(q < p)

        return _icdf(pm.Uniform.dist().random(point=point, size=size))

    return _rng

所以，要填写这个例子，应该是这样的

with pm.Model() as m:
    p = 0.3
    y = pm.DensityDist('y', lambda x: tt.switch(x, tt.log(p), tt.log(1-p)),
                       random=get_bernoulli_rng(p))
    prior = pm.sample_prior_predictive(random_seed=2019)

prior['y'].mean() # 0.306

显然，这同样可以用random=pm.Bernoulli.dist(p).random来完成，但是上面给出了一个通用的例子，说明了如何用任意分布来实现这一点，给出了它们的逆CDF，也就是说，您只需要修改_icdf和参数。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章