帮助程序代码,使使用sklearn更容易。https://github.com/aras7/scikit-learn-helper

scikit-learn-helper的Python项目详细描述


scikit learn helper是一个轻型库,其目的是提供实用功能,使使用scikit学习变得更加容易,让我们专注于解决问题,而不是编写样板代码


=0.20.2)当然:)









>pip-install-scikit-scikit-learn-helper





































如何使用?

`` python
来自sklearn_helper.model.evaluator import evaluator
models={
"dummyegressor":{
"model":dummyegressor()
}
}
evaluator=evaluator(models)

dataset=datasets.load_boston()
x,y=dataset.data,dataset.target
model=评估者。评估(x,y)
````


`` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` `使用其他指标进行评估?
```
从sklearn_helper.model.evaluator导入evaluator
从sklearn.metrics导入r2评分
模型={
"dummyegressor":{
"模型":dummyegressor()
}
}
evaluator=evaluator(模型,主要衡量指标=r2的得分


>dataset=datasets.load_boston()
>x,y=dataset.data,dataset.target
>model=evaluator.evaluator.evaevaluate(x,y)
```

` ` ` ` `
` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` ` `.00秒如何比较2 +模型?

`` python
来自sklearn_helper.model.evaluator import evaluator
models={
"dummyegressor":{
"model":dummyegressor()
},
"linearregression":{
"model":线性模型。linearregression()
}
}
计算器=计算器(模型)


数据集=数据集。加载波士顿()
x,y=数据集。数据集。target
模型=计算器。计算(x,


`````


````
`````>>
``````
````````
模型:dummyeregressor `;模型:dummyeregressor `;模型:dummyeregressor `;模型:dummyegregregregregression `;均值``均方```````>br/>模型:lineargregression `;模型:lineargregregregression `;模型:dummyecleaner `;均方````````````````
````````````时间:0.00秒减少?

`` python
来自sklearn.metrics import accurity\u score
来自sklearn\helper.model.evaluator import evaluator

models={
"dummyClassifier":{
"model":dummyClassifier()
},
"svc":{
"model":svm.svc()
}
}
evaluator=evaluator(models,main_metric=准确度得分,maximize_metric=true)


digits=数据集。load_digits()
x,y=数字。data,digits.target
model=evaluator.evaluate(x,
````





`````
>``````
>模型:svc清洁剂:dummmy清洁剂;准确度评分:0.4179;时间:0.89秒
模型:dummmy分类器;清洁剂:dummmy清洁剂:dummmy清洁剂;准确度评分:0.0896分;时间:0.00秒
`````
```````


`````````````
>`````````````````

```````````````````>
如何比较和调整模型?
`` python
来自sklearn.metrics import accurity_score
来自sklearn_helper.model.evaluator import evaluator

models={
"svc":{
"model":svm.svc()
},
"improved svc":{
"model":svm.svc(),
"params":{
"gamma":np.linspace(0,0.1,num=10),
"c":range(1,10)
}
}
}
}
evaluator=evaluator(models,main_metric=accore,maximize_metric=true)

digits=数据集。load_digits()
x,y=数字。data,digits.target
model=evaluator.evaluate(x,y)
print(model)
````

```
model:improved svc cleaner:dummycleaner accurity score:0.6511 time:0.86 sec
model:svc cleaner:dummycleaner精度得分:0.4179时间:0.89秒
svc(c=2,缓存大小=200,类权重=none,coef0=0.0,
决策函数_shape='ovr',度=3,伽马=0.0111111111111112,
核=rbf',max-iter=-1,概率=false,随机状态=none,
收缩=true,tol=0.001,verbose=false)如何获取多个度量?
```
来自sklearn.metrics import roc_auc_score,f1_score,accurity_score
来自sklearn_helper.model.evaluator import evaluator
models={
"dummyClassifier":{
"model":dummyClassifier()

"svc":{
"model":svm.svc()
}
}
evaluator=evaluator(models,main_metric=roc_auc_score,
additional_metrics=[f1_score,accurity_score],
最大化度量=真)
数字=数据集。加载乳腺癌()
x,y=数字。数据,数字。目标
模型=评估器。评估(x,
````

`````
````
模型:svc清洁剂:dummmy清洁剂:roc-auc评分:0.5000分;f1评分:0.7650分;准确度评分:0.6277分;时间:0.11秒;模型:dummmy分类器:dummmy清洁剂:dummmy清洁剂:roc-roc评分:0.11秒。u auc_u得分:0.4961 f1_u得分:0.6063准确度_u得分:0.5308时间:0.01sec
```

是:)
```
来自sklearn.metrics import accurity_score
来自sklearn_helper.model.evaluator import evaluator
来自sklearn_helper.data.datacleaner import datacleaner
来自sklearn_helper.data.dummycleaner import dummycleaner
class阈值(数据清理器):
阈值=3
定义清除训练数据(self,x,y):
返回self.清除x(x),y
定义清除测试数据(self,x):
u x=np.拷贝(x)
u x[\u x<;=自我阈值]=0
u x[\u x>;自我阈值]=1
返回x

models={
"dummyClassifier":{
"model":dummyClassifier()
},
"svc":{
"model":svm.svc(c=2,gamma=0.0111)
}
}
evaluator=evaluator(models,data_cleaners=[thresholding(),dummyCleaner()],主要指标=准确度得分


>digits=dataset.load_digits()
>x,y=digits.data,digits.target
model=evaluator.evaevaluate(x,y)
`````

`>
````>```
model:dummyClassifi器:dummyClassifi器:dummyCleaner;准确度得分:0.0940 `时间:0.0940 `时间:0.0.0940 `;时间:0.0.0.0.0 00秒
型号:DummyClassifier|清洁:阈值准确度评分:0.1035时间:0.00秒
模型:svc清洁:dummmy清洁准确度评分:0.6516;时间:0.87秒
模型:svc;清洁:阈值;准确度评分:0.8848;时间:0.28秒
````



准确度评分:0.8848;时间:0.28秒
```>br/>


br/>
https://github.com/aras7/scikit learn helper/tree/master/examples



\todo:


*添加单元测试
*为打印结果添加预测时间
*改进文档
*拆分器
*添加测试不同数据集的功能,作为"来自"的替代sklearn.model_selection import cross_val_score`.在数据清除器内部重新采样时,它可能很有用
*添加codecov.io支持




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java从其BlobKey获取Google云存储文件   java*Vert。x*:如何在同步代码中处理   java HikaiCP:如何查看连接池大小?   java解析依赖项的重复版本   java如何删除TableColumn中的HTML标记   Maven依赖项找不到sendgridjava的zip文件   Java可用的垃圾收集算法   java IntelliJ git集成技巧和技巧   java如何在安卓中实现应用内支付?   java如何在安卓中从whatsapp获取pdf文件数据到我的应用程序?   有没有一种方法可以使用JavaScript(Vue.js)将Java应用程序(游戏)实现到网站中   使用SWT浏览器进行java-to-javascript通信的问题   java在Android手机上更改字体大小后启用textView内的滚动条