python分析脚本将克服数据分析中的瘫痪。

paralytics的Python项目详细描述


https://img.shields.io/badge/python-3.7-blue.svg

这是什么?

paralletics创建包是为了简化和加速重复 建模和预测分析期间的任务。它特别强调 对数据进行预处理,这往往是建模的最艰苦阶段。

此程序包的目的是将重复性的 特定于问题的方法处理给定问题之前的活动,包括 其中包括应用机器学习技术的优化,即 然而,大多数数据科学家希望将大部分精力投入到, 根据准备不足的数据,它通常只占全部工作时间的一小部分 到项目中去。

主要功能

突出显示麻痹症患者的主要功能

  • 使用双交叉验证扩展分类变量的目标编码。 附加正则化技术防止稀疏类别的偏袒 减少对训练集的过度调整,有效减少 过度装配。
  • 使用浅决策树或 基于spearman秩次相关的方法。
  • 正在处理读取到 DataFrames, 包括:
    • 变量类型的自动统一,
    • 稀疏类别分组,
    • 将其唯一元素表示二进制响应的文本变量投影到 二进制变量,
    • 缺失数据的归责。
  • 使用诸如variance-inflation factor(vif)或correlation等因子降低共线性。

安装

依赖项

paralletics检查包要求,如果需要,在安装过程中安装 自动处理。paralletics上主要使用的软件包是:

对于可视化效果:

安装软件包的最简单方法是使用pip

pip install paralytics

如果要忽略软件包升级(当您的版本不符合要求时),请运行:

pip install paralytics --no-deps

当需要需要需要可选依赖项的功能时,您可以运行以下命令来安装这些额外的需求:

pip install paralytics[<extra-name>]

例如,要使用BaseSeleniumBrowser(需要硒)和VIFSelector(需要statsmodels),请运行:

pip install paralytics[browser,vif]

可以通过以下方式安装所有附加组件:

pip install paralytics[all]

您始终可以直接从githubrepository

pip install git+https://github.com/mrtovsky/Paralytics.git

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
swing Java按钮/网格布局   java列出Google日历中的所有事件   java无效:单击API publisher test按钮后连接到后端时出错   带有内部赋值的java While循环导致checkstyle错误   java为什么trimToSize/ensureCapacity方法提供“公共”级访问?   文件输出流的java问题   ListIterator和并发修改异常的java问题   java如何使用两个URL映射   无法识别使用“./../”构造的字符串java相对路径,为什么?   首次写入remotelyclosedsocket不会触发异常,对吗?JAVA   java OneDrive REST API为文件上载提供了400个无效谓词   Java泛型、集合接口和对象类的问题   OpenSSL Java安全提供程序   jmeter java运行jmx禁用操作