将数据拟合到多个分布和最佳分布的工具
fitter的Python项目详细描述
与Python2.7和3.5、3.6(很可能是3.4和3.7,但不是 在Travis上测试)
这是什么?
fitter包提供了一个简单的类来标识从中生成数据样本的分布。它使用来自scipy的80个分布,并允许您绘制结果以检查什么是最可能的分布和最佳参数。
安装
pip install fitter
用法
首先,让我们从gamma分布中创建一个n=10000点的数据样本:
from scipy import stats data = stats.gamma.rvs(2, loc=1.5, scale=2, size=10000)
注意
拟合速度很慢,因此请保持大小值为合理值。
现在,在不知道分布或其参数的情况下,什么样的分布最适合数据?scipy有80个发行版,fitter类将扫描所有发行版,为您调用fit函数,忽略那些失败或永远运行的发行版,最后根据平方误差之和给出最佳发行版的摘要。最好举个例子:
from fitter import Fitter f = Fitter(data) f.fit() # may take some time since by default, all distributions are tried # but you call manually provide a smaller set of distributions f.summary()
有关详细信息,请参阅online文档。