用于集成学习的堆栈库

stacking的Python项目详细描述


用于堆栈的库(堆栈一般化)
==
==




在数据/输入下设置列车和测试数据集。

2.从原始数据集创建的特征需要在
数据/输出/特征下。堆叠模型在脚本文件夹下的脚本中定义。

4.需要在脚本中定义已创建的功能。

5.只需运行``sh run.sh``(``python scripts/xxx.py```)

----




Getting Started:30秒到stacking
-

-
-



installation



sudo python setup.py install


您还可以从pypi安装堆栈:


::


——
——
——
——
——
——
——基本固定的折叠。py(堆栈类)
——数据/
——输入/

————test.csv(test数据集)

-output/

-features/
-features.csv(用户创建的功能)
-temp/
-temp.csv(在堆栈中保存的文件)

-scripts/
-script.csv(定义具体模型的主脚本)

-


-这里定义了叠加的基本模型(使用
sklearn.base.baseestimator)。
-这里定义了一些模型。例如,XGBoost、Keras、Vowpal Wabbit。
这些模型被包装为SCIKIT学习(使用< BR/SkLyn.BaseCuffiMyIn,SkPood.Base.ReasReSuxMin)。和
predict()。


可以在此处添加新的用户定义模型。


>基本模型有一些参数。

-'s':叠加。保存一个oof(out-of-fold)
预测({model\u name}u all\u fold.csv)和基于火车折叠模型的平均测试预测({model\u name}u test.csv)。这些
文件将用于下一级堆栈。

-'t':使用所有数据进行训练并预测
测试({model\\u name}\u testinallingdata.csv)。在本培训中,不使用验证数据。


-'s t':堆叠,然后使用所有数据和预测测试(“s”
和“t”)进行培训。

-'cv':仅交叉验证而不保存预测。

在脚本顶部定义task
详细信息。列车和试验特性集在此定义。需要定义cv折叠索引。

可以定义任何级别的堆叠。

-
-


todo list
-


需要更通用的库。

请检查isuues!!

…| pypi版本图像::https://badge.fury.io/py/stacking.svg
:目标:https://badge.fury.io/py/stacking
…|许可证图像::https://img.shields.io/github/license/mashape/apistatus.svg?maxage=2592000
:目标:https://github.com/ikki407/stacking/license

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何使用DBFlow进行迁移?   java无法从socket读取数据   java在JButton上使用鼠标运动监听器?   元素的java ArrayList链接和get IndexOutOfBoundsException   javascript如何在Java脚本中从ajax调用解析JSON对象   从数据库中获取信息并将其写入JTable。错误:java。lang.IndexOutOfBoundsException:索引:2,大小:2   spring如何使用Java SpringBoot在FCM推送通知中向IOS发送图像通知   java jsoup:解析某个标记的数据,该标记恰好位于某个特定标记之后   java没有HashMap的等式依赖于EntrySet。钥匙套?   未按预期评估java Maven属性(osmavenplugin)   类Java向ArrayList添加了用户输入,需要用另一个ArrayList中的变量分隔   JavaJSF丰富:每行呈现的数据列表?   集合Java 8按属性区分   在Java中,是否可以(静态)导入构造函数或局部变量?   安卓在ubuntu 10上安装java时出错64位   java是否应该hashCode()只使用equals()中使用的不可变字段的子集?   java如何创建ConcurrentMultiMap