为scikit学习管道收集乐高积木
scikit-lego的Python项目详细描述
科学玩具乐高
我们喜欢科学知识,但我们经常发现自己在写作 定制变形金刚、度量和模型。这个项目的目标 试图将它们整合到一个提供 代码质量/测试。这个项目是 荷兰多家公司。
请注意,我们根本没有正式加入scikit学习项目。乐高也一样。
安装
使用
通过pip安装scikit-lego
pip install scikit-lego
或者,要编辑和贡献您可以分叉/克隆并运行:
pip install -e ".[dev]"
python setup.py develop
文档
文档可以找到here。
用法
# the scikit learn stuff we lovefromsklearn.preprocessingimportStandardScalerfromsklearn.pipelineimportPipeline# from scikit lego stuff we addfromsklego.preprocessingimportRandomAdderfromsklego.mixtureimportGMMClassifier...mod=Pipeline([("scale",StandardScaler()),("random_noise",RandomAdder()),("model",GMMClassifier())])...
功能
以下是此库当前提供的功能列表:
sklego.preprocessing.PatsyTransformer
应用patsy公式sklego.preprocessing.RandomAdder
增加了训练中的随机性sklego.preprocessing.PandasTypeSelector
根据pandas类型选择列sklego.preprocessing.ColumnSelector
根据列名选择列sklego.preprocessing.ColumnCapper
限制模型功能的极端值sklego.preprocessing.OrthogonalTransformer
使所有功能线性独立sklego.dummy.RandomRegressor
预测随机值的基准sklego.naive_bayes.GaussianMixtureNB
通过每类每列训练1d gmm进行分类sklego.mixture.GMMClassifier
通过每个类训练一个gmm来分类sklego.mixture.GMMOutlierDetector
基于经过训练的gmm检测异常值sklego.pipeline.DebugPipeline
添加调试信息以简化调试sklego.meta.DecayEstimator
将衰减添加到模型接受的样本权重中sklego.meta.GroupedEstimator
可以将数据拆分为运行,并在每个运行上运行一个模型sklego.meta.EstimatorTransformer
添加模型输出作为功能sklego.metrics.correlation_score
计算模型输出与特征之间的相关性sklego.metrics.p_percent_score
有关敏感属性的模型公平性代理sklego.datasets.load_chicken
在快乐鸡体重数据集中加载sklego.datasets.make_simpleseries
生成一个模拟的时间序列sklego.pandas_utils.log_step
一个用于pandas管道步骤的简单记录器装饰器sklego.pandas_utils.add_lags
添加熊猫中某些列的滞后值
新功能
我们想在这里公开我们接受的东西,但我们要求三个 添加到项目之前的内容:
- 任何新功能都有助于实现可演示的真实世界用例
- 任何新功能都可以通过标准单元测试(我们有一些用于变压器和预测器)
- 此功能已在问题列表中预先讨论过