运行查询的助手函数、ml管道、squad框架的统计分析
squaad的Python项目详细描述
squad分析框架
安装
pip install squaad
释放
- v2.0
https://github.com/fostiropoulos/squaad/releases/download/v2.0/squaad-2.0.tar.gz
从二进制文件安装
pip install squaad-2.0.tar.gz
用法
创建新的数据库连接
myConnection=db("config.json","cache")
print("Connection Status: %s"%myConnection.testConnection())
config.json和缓存
- config.json遵循以下格式:
{"pgsql":{"host":"","user":"","passwd":"","db":""} }
- 缓存文件夹用于保存查询结果,并在下次执行查询时使用缓存。
games-howell统计检验
stats.gamesHowellBinomial({"GROUP1":{True:100, False:3999}, "GROUP2":{True:2999,False:2939}})
使用Kfold
的分类管道参数
X
带有一组数据的pandas数据框。每列都是一个功能Y
数据集的标签。split_columns
(可选)未实现,要拆分的列。这是可能有偏差的列,我们在拆分时会考虑到kfolds
(可选)要运行的折叠数。classifiers
(可选)包含要使用的分类器的词典balancers
(可选)要运行的平衡器
分类器
默认分类器:
- 近邻
- 线性支持向量机
- 径向基函数支持向量机
- 高斯过程
- 决策树
- 随机林
- 神经网络
- Adaboost
- 天真的贝耶斯
- qda
平衡器
默认分类器:
- 不平衡
- 击打
- 窒息
- 烟熏蛋卷
- 随机欠采样器
ml管道示例
X=df[['locs_inc', 'cplxs_inc', 'smls_inc', 'vuls_inc', 'fbgs_inc', 'locs_dec', 'cplxs_dec', 'smls_dec', 'vuls_dec', 'fbgs_dec']]
Y=df['affiliation']
mlPipeline.classificationPipeLineKfold(X,Y)