用DNN预测百分位(或标准差)

2024-05-16 18:12:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我们使用一个DNN(带有Keras和Tensorflow)来根据一些数据来预测一个值y,效果非常好。现在我们想扩展它,不仅预测值y,而且预测它以百分位的形式分布。在

举个例子:假设我们在处理房价问题。一个特定的真实的房子(数据为X’)目前售价为100万,因此y(X’) = 1 000 000,但我们知道这是一个很高的价格。我们估计90%的可比房屋(具有相同的X’的房子)的售价更便宜,因此{}的第90个百分位值为100万。在

我们如何使用我们的数据集(X,y)来训练DNN来预测/估计y(X')的第90个百分位是100万?在

在某种程度上,这样一个网络不仅要知道用哪个值可以使成本函数最小化,还要知道在哪个输入处噪声有多大。再举一个例子,假设我们有一个特定的X',在这个价格不变,为10万美元(例如,因为一些国营项目建造了数千栋完全相同的房子,而这些房子的售价都正好是10万美元)。我想让网络不仅了解10万的价值,而且这是一个非常精确的预测。在

我想如果我们能预测标准差,我们就可以计算出一个合理的百分位分布,所以也许标准差就足够了。在


Tags: 数据网络tensorflow价格形式例子keras效果