可重构预处理器库
prepnet的Python项目详细描述
准备工作
可重构的预处理器库。在
有这个图书馆的概念。在
- 所有预处理都可以保存为pickle。在
- 特征分析的可重构预处理
示例
一个简单的例子见examples/01_虹膜.ipynb 在实例的一部分,对虹膜数据集进行了预处理。在
importprepnetfromsklearnimportdatasets# Load dataset.iris=datasets.load_iris()df=pd.DataFrame(iris.data,columns=iris.feature_names)df['target']=iris.target_names[iris.target]# Scale by std and mean, and split 5 folds.context=prepnet.FunctionalContext()withcontext.enter('normalize'):# All pre-process method allow method chain.context['sepal length (cm)','sepal width (cm)','petal length (cm)','petal width (cm)',].standardize()# context.post is execute always after other preprocesses.withcontext.enter('post'):context.split()# convert python list object from prepnet.DataFrameArray.preprocessed_df_list=list(context.encode(df))# Concat first 4 element for train dataset.train_df=pd.concat(preprocessed_df_list[:4],axis=0)# Use last element for test dataset.test_df=preprocessed_df_list[-1]
而上述预处理器上下文可以很容易地禁用规范化
^{pr2}$你还记得这个吗?在
老板:嘿,新结果和旧结果有什么区别?在
某人:嗯,有些预处理是不同的。在
老板:好的。让我看看数据集。在
有人:是的,先生。是这个和这个。在
老板:两个数据集有什么区别?差异产生的值是轻微的,预处理有什么区别?在
某人:嗯,我只是不知道。在
老板:为什么?数据集包含一个commit-id,您使用git管理源代码。在
某人:即使我知道它是从哪个版本的数据集创建的。我会把细节注释掉并进行预处理。。。在
老板:嘿,你。。。在
安装
pip install prepnet
或者
git clone https://github.com/elda27/prepnet
cd prepnet
python setup.py install
试验
python -m pytest --cov=prepnet
- 项目
标签: