计算多个相关性的统计方法

man的Python项目详细描述


很多

这个包为经常实现的统计和可视化方法提供了一个通用的工具箱。请参阅blog post,以了解此包的用途和使用的方法的说明。在

Full documentation

安装

pip install many

注意:如果要使用CUDA加速统计方法(即many.stats.mat_mwu_gpu),还必须独立安装cupy的相应版本。在

组件

统计方法

统计方法包括几个用于变量对之间关联挖掘的函数。这些方法针对pandas数据帧进行了优化,并受到numpy提供的corrcoef函数的启发。在

因为这些函数依赖于numpy提供的本机矩阵级操作,因此许多函数比基于简单循环的替代方法要快一个数量级。这使得它们有助于构建大型关联网络或特征提取,在生物标志物发现等领域有重要用途。所有方法也返回统计显著性的估计值。在

在某些情况下,例如相关系数的计算,这些矢量化方法都带有numerical instability的警告。作为一种折衷方案,还提供了基于“天真”循环的实现来进行测试和比较。建议用这些基本方法验证矢量化方法得到的任何重要结果。在

下面按变量比较类型列出了当前可用的函数。基准测试还提供了与基于等效循环的方法的比较。在所有方法中,都提供了一个melt选项,以将输出作为一组行-列变量变量对统计矩阵或作为单个DataFrame返回,每个统计信息都融合到一列中。在

视觉方法

还包括几种视觉方法来解释统计方法的结果。与统计方法一样,这些方法也按绘制的变量类型分组。在

发展

  1. 使用poetry install安装依赖项
  2. 使用poetry shell初始化环境
  3. 使用pre-commit install初始化预提交钩子

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
任务“:app:compiledBugJava”与“;”的java Android执行失败预期   cmd Java找不到主类   应用程序关闭后java还原Android回栈   无法识别Java中通过OutputStream发送到Firefox的HTML代码   Redis hmget的java超时时间   排序java如何生成按字母顺序排序集合的泛型函数   java从何处提取默认编码?   必须指定java Spring引导安全配置authenticationManager   创建目录的java单元测试代码   初始化期间的java空变量   java如何通过同一个交换机编码启用和禁用Wifi、移动数据和GPS?   java将顺序UI作业排队并在UI中显示它们   java JMS连接未连接到远程JBoss,但连接本地实例   swing Java多GUI窗口创建   包装jar的java OSGi服务   java意外字符“ï”,使用Jackson解析JSON