scikit从civis分析中学习相容估计量
civisml-extensions的Python项目详细描述
Scikit从Civis Analytics学习兼容的估计器
安装
建议使用pip安装:
$ pip install civisml-extensions
对于开发,需要一些附加的依赖项:
$ pip install -r dev-requirements.txt
内容和用法
此包包含用于堆叠的scikit-learn兼容估计器( StackedClassifier,StackedRegressor,非线性回归( NonNegativeLinearRegression,预处理pandasDataFrames( DataFrameETL,并使用Hyperband交叉验证超参数( HyperbandSearchCV)。
这些估计器的使用遵循标准的sklearn约定。这是一个 使用StackedClassifier:
的示例>>> from sklearn.linear_model import LogisticRegression >>> from sklearn.ensemble import RandomForestClassifier >>> from civismlext.stacking import StackedClassifier >>> # Note that the final estimator 'metalr' is the meta-estimator >>> estlist = [('rf', RandomForestClassifier()), >>> ('lr', LogisticRegression()), >>> ('metalr', LogisticRegression())] >>> mysm = StackedClassifier(estlist) >>> # Set some parameters, if you didn't set them at instantiation >>> mysm.set_params(rf__random_state=7, lr__random_state=8, >>> metalr__random_state=9, metalr__C=10**7) >>> # Fit >>> mysm.fit(Xtrain, ytrain) >>> # Predict! >>> ypred = mysm.predict_proba(Xtest)
您可以了解有关堆栈的更多信息,并在2017年11月的a talk presented at PyData NYC中看到StackedRegressor和NonNegativeLinearRegression估计器的示例使用。
有关更多信息,请参见各种估计器的doc字符串。
贡献
请参阅CONTIBUTING.md以获取有关对此项目作出贡献的信息。
许可证
BSD-3
有关详细信息,请参见LICENSE.md。