我正在解决一个数据科学问题,即预测distance
得失。每playID
就有22个距离的预测。你知道吗
这个22预测是一个playID
的单个测试实例。现在我需要将这22个预测转换成给定格式的CDF分数:
distance-99 distance-98 ...........distance0 distance1................distance99
0 0 1 1 ............. 1
换句话说,我们预测的每一列(从distance-99
到distance99
)都表明了团队在比赛中获得<;=那么多距离的概率。CRP计算如下:
C=1199N∑m=1N∑n=−9999(P(y≤n)−H(n−Ym))2
其中p是预测分布,N是测试集中的播放次数,Y是实际距离,H(x)是Heaviside阶跃函数(x≥0时H(x)=1,否则为零)。你知道吗
如果任何一个预测值被忽略,它将失败
p(y≤k)>;p(y≤k+1) 对于任何k(即CDF必须是非递减的)。你知道吗
假设我的predict
函数返回22个值的列表:
k=[1,2,4,5,6,7,8,........22]
现在使用k,如何使用概率值填充从distance-99
到distance99
的列?你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐