为scikit学习管道收集乐高积木

scikit-lego的Python项目详细描述


Build statusDocumentation StatusDownloads

科学玩具乐高

我们喜欢科学知识,但我们经常发现自己在写作 定制变形金刚、度量和模型。这个项目的目标 试图将它们整合到一个提供 代码质量/测试。这个项目是 荷兰多家公司。

请注意,我们根本没有正式加入scikit学习项目。乐高也一样。

安装

使用

通过pip安装scikit-lego
pip install scikit-lego

或者,要编辑和贡献您可以分叉/克隆并运行:

pip install -e ".[dev]"
python setup.py develop

文档

文档可以找到here

用法

# the scikit learn stuff we lovefromsklearn.preprocessingimportStandardScalerfromsklearn.pipelineimportPipeline# from scikit lego stuff we addfromsklego.preprocessingimportRandomAdderfromsklego.mixtureimportGMMClassifier...mod=Pipeline([("scale",StandardScaler()),("random_noise",RandomAdder()),("model",GMMClassifier())])...

功能

以下是此库当前提供的功能列表:

  • sklego.preprocessing.PatsyTransformer应用patsy公式
  • sklego.preprocessing.RandomAdder增加了训练中的随机性
  • sklego.preprocessing.PandasTypeSelector根据pandas类型选择列
  • sklego.preprocessing.ColumnSelector根据列名选择列
  • sklego.preprocessing.ColumnCapper限制模型功能的极端值
  • sklego.preprocessing.OrthogonalTransformer使所有功能线性独立
  • sklego.dummy.RandomRegressor预测随机值的基准
  • sklego.naive_bayes.GaussianMixtureNB通过每类每列训练1d gmm进行分类
  • sklego.mixture.GMMClassifier通过每个类训练一个gmm来分类
  • sklego.mixture.GMMOutlierDetector基于经过训练的gmm检测异常值
  • sklego.pipeline.DebugPipeline添加调试信息以简化调试
  • sklego.meta.DecayEstimator将衰减添加到模型接受的样本权重中
  • sklego.meta.GroupedEstimator可以将数据拆分为运行,并在每个运行上运行一个模型
  • sklego.meta.EstimatorTransformer添加模型输出作为功能
  • sklego.metrics.correlation_score计算模型输出与特征之间的相关性
  • sklego.metrics.p_percent_score有关敏感属性的模型公平性代理
  • sklego.datasets.load_chicken在快乐鸡体重数据集中加载
  • sklego.datasets.make_simpleseries生成一个模拟的时间序列
  • sklego.pandas_utils.log_step一个用于pandas管道步骤的简单记录器装饰器
  • sklego.pandas_utils.add_lags添加熊猫中某些列的滞后值

新功能

我们想在这里公开我们接受的东西,但我们要求三个 添加到项目之前的内容:

  1. 任何新功能都有助于实现可演示的真实世界用例
  2. 任何新功能都可以通过标准单元测试(我们有一些用于变压器和预测器)
  3. 此功能已在问题列表中预先讨论过

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在一个问题被连续正确回答三次/并添加差异后,我如何将程序循环回开始   Java中未实例化的匿名类   java如何在Android中录制视频,只允许横向模式和最长时间录制时间   java从另一个活动发送实时消息   多线程java线程和互斥   java禁用Spring安全日志   JAVA伊奥。StreamCorruptedException:在与子级和父级ProcessBuilder通信时写入子级中的标准输出时,流头无效   使用Java(HttpURLConnection)对Restheart进行身份验证(对于Mongodb)   java如何解决Jenkins中的SAXParseException?   java为什么我需要mockito来测试Spring应用程序?   计算sin-cos和tan时缺乏精度(java)   java Hibernate。不同项目中相同一对一映射的不同行为   java图像滑块:如何使用JavaFX将图像放在另一个图像上   java Mockito在使用when时抛出NotAMockException   http Java servlet发送回响应