擅长:python、mysql、java
<p>等概率箱的近似解:</p>
<ul>
<li>估计分布参数</li>
<li>如果是scipy.stats.distribution,则使用逆cdf,ppf来获取常规概率网格的binedges,例如<code>distribution.ppf(np.linspace(0, 1, n_bins + 1), *args)</code></li>
<li>然后,使用np.histogram统计每个bin中的观察数</li>
</ul>
<p>然后对频率进行chisquare检验。</p>
<p>另一种方法是从已排序数据的百分位数中查找bin边缘,并使用cdf来查找实际的概率。</p>
<p>这只是一个近似值,因为chisquare检验的理论假设参数是通过组合数据的最大似然估计的。我不确定基于数据的二边选择是否影响渐近分布。</p>
<p>我很久没调查过了。
如果近似解不够好,那么我建议您在stats.stackexchange上提问。</p>