选择、加权和分析复杂的样本数据
samplics的Python项目详细描述
samplics是一个python包,用于选择、加权和分析从复杂采样设计中获得的样本。在
安装
pip install samplics
如果您的计算机上同时安装了python2.x和python3.x,则可能必须使用:pip3 install samplics
使用
使用PPS法选择一个主要采样单元的样本, 我们可以使用类似的代码:
importsamplicsfromsamplics.samplingimportSampleSelectionpsu_frame=pd.read_csv("psu_frame.csv")psu_sample_size={"East":3,"West":2,"North":2,"South":3}pps_design=SampleSelection(method="pps-sys",stratification=True,with_replacement=False)frame["psu_prob"]=pps_design.inclusion_probs(psu_frame["cluster"],psu_sample_size,psu_frame["region"],psu_frame["number_households_census"])
根据设计调整样品重量, 我们可以使用类似的代码:
^{pr2}$importsamplicsfromsamplics.estimationimportTaylorEstimation,ReplicateEstimatorzinc_mean_str=TaylorEstimator("mean").estimate(y=nhanes2f["zinc"],samp_weight=nhanes2f["finalwgt"],stratum=nhanes2f["stratid"],psu=nhanes2f["psuid"],remove_nan=True)ratio_wgt_hgt=ReplicateEstimator("brr","ratio").estimate(y=nhanes2brr["weight"],samp_weight=nhanes2brr["finalwgt"],x=nhanes2brr["height"],rep_weights=nhanes2brr.loc[:,"brr_1":"brr_32"],remove_nan=True)
贡献
待定
许可证
项目状态
这是测试版。现阶段,本项目不建议 用于生产或用户所依赖的任何项目。在
- 项目
标签: