连续排名概率得分(CRPS)。预测获得的距离或服务水平的累积概率分布

2024-04-20 02:49:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在解决一个数据科学问题,即预测distance得失。每playID就有22个距离的预测。你知道吗

这个22预测是一个playID的单个测试实例。现在我需要将这22个预测转换成给定格式的CDF分数:

  distance-99 distance-98 ...........distance0 distance1................distance99
   0            0                      1         1       .............      1

换句话说,我们预测的每一列(从distance-99distance99)都表明了团队在比赛中获得<;=那么多距离的概率。CRP计算如下:

      C=1199N∑m=1N∑n=−9999(P(y≤n)−H(n−Ym))2

其中p是预测分布,N是测试集中的播放次数,Y是实际距离,H(x)是Heaviside阶跃函数(x≥0时H(x)=1,否则为零)。你知道吗

如果任何一个预测值被忽略,它将失败

p(y≤k)>;p(y≤k+1) 对于任何k(即CDF必须是非递减的)。你知道吗

假设我的predict函数返回22个值的列表:

              k=[1,2,4,5,6,7,8,........22]

现在使用k,如何使用概率值填充从distance-99distance99的列?你知道吗


Tags: 数据实例函数距离格式科学团队概率