我希望能够为正态分布绘制一条类似cumulative distribution function的线,因为它对于模拟采用曲线非常有用:
具体来说,我希望能够使用初始数据(产品采用率)来推断该曲线的其余部分,从而粗略估计每个阶段的时间线。例如,如果我们在30天内达到10%的渗透率,在40天内达到20%的渗透率,我们试着拟合这条曲线,我想知道我们什么时候才能达到80%的渗透率(而另一个人口可能需要50天才能达到10%的渗透率)
所以,我的问题是,我该怎么做呢?理想情况下,我能够提供初始数据(时间和渗透率),并使用python(例如matplotlib)为我绘制图表的其余部分。但我不知道从哪里开始!谁能给我指出正确的方向吗
(顺便说一句,我也在CrossValidated上发布了这个问题,但我不确定它是属于那里,因为它是一个统计问题,还是属于这里,因为它是一个python问题。为重复道歉!)
cdf可以通过
scipy.stats.norm.cdf()
计算。它的ppf
可用于帮助映射所需的对应关系scipy.interpolate.pchip
然后可以创建一个函数,以使变换平滑插值对
desired_xy
仅使用两个点,曲线将线性拉伸。如果给出更多点,将应用平滑变换。下面是使用[(0, 1), (30, 10), (40, 20), (90, 99)]
时的情况。请注意0 %
和100 %
将导致问题,因为它们位于正负无穷远处相关问题 更多 >
编程相关推荐