我想知道是否有人能解释一下下面的函数scipy.stats公司执行:
rv_continuous.expect
rv_continuous.pdf
我已经看过文件了,但是我还是很困惑。在
这是我的任务,理论上很简单,但我仍然对这些函数的作用感到困惑。在
163个区域的值。我想找出变量区域取一个较小值,称为“inf”和较大值“sup”之间的任何值的概率。在
所以,我的想法是:
^{pr2}$
所以我可以得到sup和inf之间任何区域的概率
有谁能帮我简单地解释一下这些函数的作用,以及如何计算inf和sup之间f(a)的积分吗?在
谢谢
布莱斯
Tags:
累积密度函数可能会给你想要的。 那么介于两个值之间的概率
P
为P(inf < area < sup) = cdf(sup) - cdf(inf)
有一个关于概率here和{a2}的教程 他们都是亲戚。pdf是概率的“密度”。它们必须大于零且和等于1。我认为它表明了某件事的可能性有多大。期望值是平均值概念的概括。在
rv_continuous
是scipy.stats
中实现的所有概率分布的基类。您不会自己对rv_continuous
调用方法。在你的问题并不完全清楚你想做什么,所以我假设你有一个16383个数据点的数组,这些数据点是从一些未知的概率分布中提取出来的。从原始数据中,您将需要估计累积分布,在}值处找到该累积分布的值,并减去该值以找到从未知分布中提取值的概率。在
sup
和{有很多方法可以根据数据估计未知分布,这取决于你想做多少建模和你想做多少假设。在更复杂的情况下,您可以尝试将一个标准参数概率分布拟合到数据中。例如,如果您怀疑您的数据是对数正态分布的,那么可以使用
scipy.stats.lognorm.fit(data, floc=0)
来查找适合您的数据的对数正态分布的参数。然后可以使用scipy.stats.lognorm.cdf(sup, *params) - scipy.stats.lognorm.cdf(inf, *params)
来估计值介于这些值之间的概率。在中间是分布估计的非参数形式,如直方图和核密度估计。例如,
scipy.stats.gaussian_kde(data).integrate_box_1d(inf, sup)
是使用未知分布的高斯核密度估计进行此估计的简单方法。然而,核密度估计并不总是合适的,需要一些调整才能正确。在您可以做的最简单的事情就是计算}之间的数据点的数量,然后除以您拥有的数据点总数。这只适用于较大数量的点(您有)和边界不太远的数据尾部。在
inf
和{相关问题 更多 >
编程相关推荐