在Python中绘制95%置信区间

2024-06-09 04:18:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用高斯过程回归来拟合我的数据,效果非常好。然而,当我试图根据我的估计绘制置信区间时。我得到一张混乱的图表,见下图

enter image description here

红线表示上CI,蓝线表示下CI,黑线表示我的估计数据。我已经为此编写了以下代码

f3 = plt.figure()
plt.plot(X_te_rescale[:,0],pred_y.ravel(),'k.',markersize=20,label='prediction')
plt.plot(X_te_rescale[:,0],low_CIs,'b.',markersize=2)
plt.plot(X_te_rescale[:,0],Upper_CIs,'r.',markersize=2)
plt.legend(loc='1')
plt.show()

我在谷歌上搜索,发现fill between在这方面很有用,因此也使用了它,结果也很糟糕。见下图

enter image description here

主GP代码

pred_y, sigma = gpr.predict(X_te_rescale, return_std=True)
confidence_interval = sigma * 1.96
low_CIs=pred_y - confidence_interval
Upper_CIs= pred_y + confidence_interval

我为此编写的代码如下

plt.scatter(X_tr_rescale, y_tr_rescale, label='Train data')
plt.fill_between(X_te_rescale[:,0],
                  pred_y[:,0] - confidence_interval,
                  pred_y[:,0] + confidence_interval,
                  facecolor='black', alpha=0.5, label='95% confidence interval')
plt.gca().set_title(gp.kernel_)
plt.plot(X_te_rescale, pred_y, 'r.',label='Prediction')

详情如下

y_te_rescale: Array of floats64 (1188,1)
sigma: Array of floats64 (1188,)
Confidence interval: Array of floats64 (1188,)
lower CIs: Array of floats64 (1188,1188)
upper CIs: Array of floats64 (1188,1188)
pred_y: Array of floats64 (1188,1)

是否可能有一个不与我的估计值重叠的CI?或者我错过了什么。提前谢谢。 根据注释,我修改了代码如下

x_unsorted=X_te_rescale.flatten()
pred_y=pred_y.flatten()
sorted_inds = np.argsort(x_unsorted)
plt.fill_between(
    x_unsorted[sorted_inds],
    (pred_y - confidence_interval)[sorted_inds],
    (pred_y+ confidence_interval)[sorted_inds],
    label='95% CI',
)
plt.plot(
    x_unsorted[sorted_inds], 
    pred_y.ravel[sorted_inds], 
    'r--',
    label='Prediction',
)

该图如下所示

enter image description here

上面的代码虽然显示了置信区间,但无法估计值。这个代码正确吗?或者如何将置信区间与可以清楚看到的估计值一起绘制


Tags: of代码plotpltarraylabelsortedconfidence
1条回答
网友
1楼 · 发布于 2024-06-09 04:18:49

使用plt.fill_between的问题是x值没有排序plt.plot如果绘制的是一条直线而不是一组点,则会产生类似的糟糕结果

试着这样做:

sorted_inds = np.argsort(x_unsorted)
plt.fill_between(
    x_unsorted[sorted_inds],
    (y_pred - conf_intervals)[sorted_inds],
    (y_pred + conf_intervals)[sorted_inds],
    label='95% CI',
)
plt.plot(
    x_unsorted[sorted_inds], 
    y_pred[sorted_inds], 
    'k-',
    label='Prediction',
)

相关问题 更多 >