pythonscipy.stats公司pdf和expect函数

2024-04-19 08:52:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道是否有人能解释一下下面的函数scipy.stats公司执行:

rv_continuous.expect
rv_continuous.pdf

我已经看过文件了,但是我还是很困惑。在

这是我的任务,理论上很简单,但我仍然对这些函数的作用感到困惑。在

163个区域的值。我想找出变量区域取一个较小值,称为“inf”和较大值“sup”之间的任何值的概率。在

所以,我的想法是:

^{pr2}$

所以我可以得到sup和inf之间任何区域的概率

有谁能帮我简单地解释一下这些函数的作用,以及如何计算inf和sup之间f(a)的积分吗?在

谢谢

布莱斯


Tags: 文件函数区域pdfstats公司scipy理论
2条回答

累积密度函数可能会给你想要的。 那么介于两个值之间的概率PP(inf < area < sup) = cdf(sup) - cdf(inf)

有一个关于概率here和{a2}的教程 他们都是亲戚。pdf是概率的“密度”。它们必须大于零且和等于1。我认为它表明了某件事的可能性有多大。期望值是平均值概念的概括。在

E[x] = sum(x.P(x))

rv_continuousscipy.stats中实现的所有概率分布的基类。您不会自己对rv_continuous调用方法。在

你的问题并不完全清楚你想做什么,所以我假设你有一个16383个数据点的数组,这些数据点是从一些未知的概率分布中提取出来的。从原始数据中,您将需要估计累积分布,在sup和{}值处找到该累积分布的值,并减去该值以找到从未知分布中提取值的概率。在

有很多方法可以根据数据估计未知分布,这取决于你想做多少建模和你想做多少假设。在更复杂的情况下,您可以尝试将一个标准参数概率分布拟合到数据中。例如,如果您怀疑您的数据是对数正态分布的,那么可以使用scipy.stats.lognorm.fit(data, floc=0)来查找适合您的数据的对数正态分布的参数。然后可以使用scipy.stats.lognorm.cdf(sup, *params) - scipy.stats.lognorm.cdf(inf, *params)来估计值介于这些值之间的概率。在

中间是分布估计的非参数形式,如直方图和核密度估计。例如,scipy.stats.gaussian_kde(data).integrate_box_1d(inf, sup)是使用未知分布的高斯核密度估计进行此估计的简单方法。然而,核密度估计并不总是合适的,需要一些调整才能正确。在

您可以做的最简单的事情就是计算inf和{}之间的数据点的数量,然后除以您拥有的数据点总数。这只适用于较大数量的点(您有)和边界不太远的数据尾部。在

相关问题 更多 >