边界附近概率密度函数(pdf)的差估计

2024-04-19 21:41:18 发布

您现在位置:Python中文网/ 问答频道 /正文

当使用stats.kde.gaussian_kde估计[0,1]中的值的pdf时,如果这些值是均匀分布的,stats.kde.gaussian_kde给出的结果非常差,接近边界(接近0和接近1)。请参见下面的代码和图片

有什么办法来处理这种接近边界的糟糕估计吗

enter image description here

import numpy as np
import random
import scipy.stats as stats
import matplotlib.pyplot as plt

X = [random.uniform(0,1) for _ in range(10000)]
linsp = np.linspace(0, 1, 1000)

nparam_density = stats.kde.gaussian_kde(X)
nparam_density = nparam_density(linsp)

fig, ax = plt.subplots(figsize=(10, 6))
ax.hist(X, bins=30, normed=True)
ax.plot(linsp, nparam_density, 'r-', label='non-parametric density (smoothed by Gaussian kernel)')
ax.legend(loc='best')
fig.savefig('pdf.png')

Tags: importpdfasstatsnpfigpltrandom