可重构预处理器库

prepnet的Python项目详细描述


MIT LicenseBuild Statuscodecov

准备工作

可重构的预处理器库。在

有这个图书馆的概念。在

  • 所有预处理都可以保存为pickle。在
  • 特征分析的可重构预处理

示例

一个简单的例子见examples/01_虹膜.ipynb 在实例的一部分,对虹膜数据集进行了预处理。在

importprepnetfromsklearnimportdatasets# Load dataset.iris=datasets.load_iris()df=pd.DataFrame(iris.data,columns=iris.feature_names)df['target']=iris.target_names[iris.target]# Scale by std and mean, and split 5 folds.context=prepnet.FunctionalContext()withcontext.enter('normalize'):# All pre-process method allow method chain.context['sepal length (cm)','sepal width (cm)','petal length (cm)','petal width (cm)',].standardize()# context.post is execute always after other preprocesses.withcontext.enter('post'):context.split()# convert python list object from prepnet.DataFrameArray.preprocessed_df_list=list(context.encode(df))# Concat first 4 element for train dataset.train_df=pd.concat(preprocessed_df_list[:4],axis=0)# Use last element for test dataset.test_df=preprocessed_df_list[-1]

而上述预处理器上下文可以很容易地禁用规范化

^{pr2}$

你还记得这个吗?在

老板:嘿,新结果和旧结果有什么区别?在

某人:嗯,有些预处理是不同的。在

老板:好的。让我看看数据集。在

有人:是的,先生。是这个和这个。在

老板:两个数据集有什么区别?差异产生的值是轻微的,预处理有什么区别?在

某人:嗯,我只是不知道。在

老板:为什么?数据集包含一个commit-id,您使用git管理源代码。在

某人:即使我知道它是从哪个版本的数据集创建的。我会把细节注释掉并进行预处理。。。在

老板:嘿,你。。。在

安装

pip install prepnet

或者

git clone https://github.com/elda27/prepnet
cd prepnet
python setup.py install

试验

python -m pytest --cov=prepnet

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
“电话目录”数据结构的java实现   使用PC remote读取JSP页面上的文件时出现java错误   无法在不同目录中从Java执行Python脚本   java无法在windows 8.1上运行javafx应用程序   java航空公司系统如何防止两个用户同时预订同一个座位?   反射如何在java方法中获取每个参数的名称和值?   阅读中的字符串问题。txt文档并在Java中编辑   java JTextPane行包装问题   使用PowerMock Android Junit时出现java ClassNotFoundException   java输入和If语句   java如何在不使用剪贴板或操作CTRL+C、CTRL+V的情况下将字符串中的“\t”或“tab”发送到selenium中的文本框中   tomcat7将Java应用程序部署到Digitalocean中的Tomcat根目录   响应中嵌套映射的java问题(Jersey)