统计自组织分析与离群点检测算法
scikit-posthocs的Python项目详细描述
scikit posthocs是一个python包,它为成对多个比较提供事后测试,这些比较通常在统计数据分析中执行,以便在获得方差分析的统计显著结果时评估组水平之间的差异。
scikit posthocs与pandas数据帧和numpy数组紧密集成,确保快速计算和方便的数据导入和存储。
这个软件包对于在工作中使用python的统计学家、数据分析师和研究人员非常有用。
背景
python统计生态系统由多个包组成。然而,它仍有许多差距,并被R包和能力所超越。
SciPy(1.2.0版)提供student、wilcoxon和mann-whitney测试,这些测试不适合多对比较。Statsmodels(0.9.0版)的功能是tukeyhsd测试,它需要一些额外的操作才能顺利地集成到数据分析管道中。Statsmodels还有很好的助手方法:allpairtest(将外部函数(如scipy.stats.ttest_ind)调整为多个成对比较)和multipletests(调整p值以最小化类型i和ii错误)。PMCMRplus是一个非常好的r包,它在python中没有竞争对手,因为它为factorial和block设计数据提供了40多种测试(包括后hoc测试)。pmcmrplus是scikit posthocs的灵感和参考。
scikit posthocs试图通过提供大量参数化和非参数化的post hoc测试以及异常值检测和基本绘图方法来改进python的统计功能。
功能
- parametric成对多个比较测试:
- 舍夫测试。
- 学生t测试。
- Tahmane T2试验。
- TukeyHSD测试。
- factorial design的非参数测试:
- Conover测试。
- 邓恩测试。
- 德沃斯,钢铁,小动物,飞行试验。
- 曼惠特尼测试。
- Nashimoto和Wright(NPM)测试。
- 内门尼测试。
- 范瓦尔登测试。
- 威尔科克森试验。
- 块设计的非参数测试:
- Conover测试。
- Durbin和Conover测试。
- 米勒测试。
- 内门尼测试。
- 四边形测试。
- 西格尔测试。
- 其他测试:
- 安德森-达林测试。
- 麦克·沃尔夫测试。
- 海特(OSRT)测试。
- 异常值检测测试:
- 基于四分位范围(IQR)的简单测试。
- 格拉布斯测试。
- Tietjen Moore测试。
- 广义极端学习偏离试验(ESD试验)。
- 绘图功能(如显著性绘图)。
所有的事后检验都能对多对比较进行p调整。
兼容性
包与Python2和Python3兼容。
安装
您可以使用pip:
$ pip install scikit-posthocs