这是一个采样模拟器
samplingsimulatorp的Python项目详细描述
采样模拟
samplingsimulatorpy
是一个Python包,旨在帮助那些教授或学习基本统计推断。在
作者
Name | GitHub |
---|---|
Holly Williams | hwilliams10 |
Lise Braaten | lisebraaten |
Tao Guo | tguo9 |
Yue (Alex) Jiang | YueJiangMDSV |
概述
该软件包允许用户生成虚拟总体,可以从中进行采样,以便比较和对比不同样本大小的样本与采样分布。该软件包还允许用户从生成的虚拟总体(或任何其他总体)中取样,绘制分布图,并查看感兴趣参数的摘要。在
安装:
pip install -i https://test.pypi.org/simple/ samplingsimulatorpy
功能描述
generate_virtual_pop
创建虚拟总体。- Inputs:分布函数(即
np.random.lognormal
,np.random.binomial
等)、分布函数所需的参数以及总体的大小。在 - Outputs:虚拟人口作为一个tible
- Inputs:分布函数(即
draw_samples
生成不同大小的样本- Inputs:要从中采样的总体、样本大小和样本数
- Outputs:返回一个tible,其中一列是示例编号,第二列是值。在
plot_sample_hist
为不同的样本大小创建样本分布。- Inputs:要从中采样的总体、要绘制的样本以及样本大小的向量
- Outputs:返回样本分布图的网格
plot_sampling_dist
为不同的样本大小创建采样分布。- Inputs:要从中采样的总体、要绘制的样本以及样本大小的向量
- ^{str>
stat_summary
:返回感兴趣的统计参数的摘要- Inputs:总体、样本、感兴趣的参数
- Outputs:摘要tible
这些如何融入Python生态系统?
据我们所知,目前还没有一个现有的Python包具有创建虚拟总体和生成上述特定示例和采样分布的特定功能。我们确实利用了许多现有的Python包,并对它们进行了扩展,以生成非常具体的函数。其中包括:
scipy.stats
获取分布函数np.random
生成随机样本- Altair创建绘图
Python pandas
已经包含了一些摘要统计功能,比如.describe()
,但是我们的包将更加可定制。我们的总结只包括感兴趣的统计参数,并将提供样本、抽样和真实总体参数之间的比较。在
依赖性
- python=“^3.7”
- 熊猫“^1.0.1”
- numpy=“^1.18.1”
- 牛郎星=“^4.0.1”
使用
generate_virtual_pop
^{pr2}$
参数:
size
:样本数distribution_func
:我们从中生成样本的分布*para
:分布函数所需的参数
示例:
pop = generate_virtual_pop(100, np.random.normal, 0, 1)
draw_samples
from samplingsimulatorpy import draw_samples
draw_samples(pop, reps, n_s)
参数:
pop
作为数据帧的虚拟人口reps
每个样本大小的复制数为整数 价值n_s
将每个样本的样本大小作为列表
示例:
samples = draw_samples(pop, 3, [5, 10, 15, 20])
plot_sample_hist
from samplingsimulatorpy import plot_sample_hist
plot_sample_hist(pop, samples)
参数:
pop
作为数据帧的虚拟人口samples
将样本作为数据帧
示例:
plot_sample_hist(samples)
plot_sampling_hist
from samplingsimulatorpy import plot_sampling_hist
plot_sampling_hist(pop, samples)
参数:
samples
将样本作为数据帧
示例:
plot_sampling_hist(samples)
stat_summary
from samplingsimulatorpy import stat_summary
plot_sampling_hist(pop, samples, parameter)
参数
population
虚拟人口samples
抽取的样品parameter
感兴趣的参数
示例
stat_summary(pop, samples, ['np.mean', 'np.std'])
示例使用场景
fromsamplingsimulatorpyimportgenerate_virtual_pop,draw_samples,plot_sample_dist,plot_sampling_dist,stat_summary# create virtual populationpop=generate_virtual_pop(100,np.random.normal,0,1)# take samplessamples=draw_samples(pop,3,[10,20])# plot sample histogramplot_sample_hist(pop,samples)
# plot sampling distributionplot_sampling_hist(samples)
# compare mean and standard deviationstat_summary(pop,samples,['np.mean','np.std'])
文档
官方文档托管在阅读文档:https://samplingsimulatorpy.readthedocs.io/en/latest/
学分
这个包是用Cookiecutter和UBC-MDS/Cookiecutter UBC MDS项目模板创建的,它是根据pyOpenSci/cookiecutter-pyopensci项目模板和audreyr/cookiecutter-pypackage修改的。在
- 项目
标签: