展望数据科学项目的未来
foreshadow的Python项目详细描述
Foreshadow是一个自动生成管道的工具,它可以创建、迭代 以及评估机器学习管道快速直观的体验 数据科学家在数据科学上花费更多的时间,而在代码上花费更少的时间。
开始
要开始使用foreshadow,请使用pip install安装包。这也会 安装依赖项。现在创建一个简单的python脚本,它使用 有前奏的默认值。
首次导入前阴影
importforeshadowasfs
同时为演示导入sklearn、pandas和numpy
importpandasaspdfromsklearn.datasetsimportboston_housingfromsklearn.model_selectionimporttrain_test_split
现在将sklearn的波士顿住房数据加载到pandas数据框中。这个 是测试机器学习模型的通用数据集,并内置到 scikit学习。
boston=load_boston()bostonX_df=pd.DataFrame(boston.data,columns=boston.feature_names)bostony_df=pd.DataFrame(boston.target,columns=['target'])
接下来,就像使用sklearn估计器一样,执行列车测试 对数据进行拆分,并将列车数据传递到新的预兆的拟合函数中 对象
X_train,X_test,y_train,y_test=train_test_split(bostonX_df,bostony_df,test_size=0.2)shadow=fs.Foreshadow()shadow.fit(X_train,y_train)
现在,fs是一个合适的预告对象,所有的特征工程 对估计量进行了训练和优化。现在可以 将其作为拟合sklearn估计量进行预测。
shadow.score(X_test,y_test)
太好了,你现在有一个工作前好的安装!继续阅读,学习如何 导出、修改和构建自己的管道。
主要功能
- 自动特征工程
- 自动模式选择
- 快速管道开发/迭代
- 自动参数优化
- 易于扩展
- scikit学习兼容
Foreshadow支持Python3.6+