在Python中操作numpy.random.exponential分布
我正在尝试使用Numpy的随机指数分布来创建一个随机数数组。这个功能我已经实现得很好,但我还有一个额外的需求,就是能够精确指定数组中有多少个元素是某个特定的值。
让我来解释一下(代码在下面,但我先试着解释一下):我生成了随机的指数分布,并绘制了数据的直方图,得到了一个漂亮的指数曲线。我真正想要的是能够使用一个变量来指定这条曲线的y轴截距(也就是曲线与y轴相交的点)。我可以通过改变直方图中的箱子数量来以一种基本的方式实现这一点,但这只会改变图表,而不会改变原始数据。
我在这里插入了我的代码框架。为了给你一些背景,我正在尝试创建一个星系的指数盘,因此我想生成的随机数组是一个半径数组,而我想要能够指定的变量是星系中心的数密度:
import numpy as N
import matplotlib.pyplot as P
n = 1000
scale_radius = 2
central_surface_density = 100 #I would like this to be the controlling variable, even if it's specification had knock on effects on n.
radius_array = N.random.exponential(scale_radius,(n,1))
P.figure()
nbins = 100
number_density, radii = N.histogram(radius_array, bins=nbins,normed=False)
P.plot(radii[0:-1], number_density)
P.xlabel('$R$')
P.ylabel(r'$\Sigma$')
P.ylim(0, central_surface_density)
P.legend()
P.show()
这段代码创建了以下直方图:
所以,总结一下,我希望能够通过控制数据的生成方式来指定这个图表与y轴的交点,而不是通过改变直方图的绘制方式。
任何帮助或进一步澄清的请求都将非常感谢。
1 个回答
13
根据numpy.random.exponential
的文档,输入参数beta是1除以lambda,这个定义在维基百科的指数分布中有说明。
你想要的是在f(x=0)=lambda=1/beta
这个点上计算这个函数。因此,在一个标准化的分布中,你的y轴截距应该就是numpy函数的倒数:
import numpy as np
import pylab as plt
target = 250
beta = 1.0/target
Y = np.random.exponential(beta, 5000)
plt.hist(Y, normed=True, bins=200,lw=0,alpha=.8)
plt.plot([0,max(Y)],[target,target],'r--')
plt.ylim(0,target*1.1)
plt.show()
是的,直方图的y轴截距会随着不同的区间大小而变化,但这并不意味着什么。你能合理讨论的唯一内容就是底层的概率分布(所以才有normed=true
这个参数)。