巨蟒的Autoweka
pyautoweka的Python项目详细描述
pyautoweka是一个用于算法选择和超参数优化的java应用程序,它构建在[weka]上(http://www.cs.ubc.ca/labs/beta/projects/autoweka/)。
安装转到项目源并安装:
```
git clone git@github.com:tdomhan/py autoweka.git
cd pyautoweka
python setup.py install
```
=pyautoweka.experiment(tuner_timeout=9000)
````
`tuner_timeout`是优化运行的时间(秒)。例如9000秒=2.5小时。运行优化的时间越长,当然就越好。(注意,“experiment”对象有一个类似于sklearn分类器的接口。)
首先我们需要加载一些数据。例如著名的[iris数据集](http://archive.ics.uci.edu/ml/dataset s/iris)。使用[这个链接](http://archive.ics.uci.edu/ml/machine learning databases/iris/iris/iris.data)下载它。我们把它加载到python中去吧:
``python
``加载数据:
import numpy as np
import ranrandom
y=np.loadtxt(“iris.data”,delimiter=”,“,usecols=[4],usecols=4],
y=y=y=np.loadtxt.load是的
洗牌数据:
index=range(len(x))
随机洗牌(index)
x=x[index]
y=y[index]
洗牌(index)
x=x[0:100]
y=y[0:100]
x=x[0:100]
x=x[0:100]
y=y[0:100]
x=x[100]
y=y[100]
y=y[100]
x=y=y[100]
并预测延迟数据的标签:
y嫒predict=experiment.predict(x嫒test)
y嫒predict=experiment.num嫒correct=sum([1表示预测,如果预测=correct,则在zip(y嫒predict,y嫒test)中正确])
打印“精度:%f%float(num嫒correct)/len(y嫒test)
`
精度高达90%s.
高级:选择特定分类器
当您不设置特定分类器时,将尝试所有可用的分类器。您可以选择将搜索限制为某些分类器,如下所示:
分类器:
``python
experience.add_classifier(“weka.classifiers.functions.simplelogistic”)
````
advanced:创建的文件在创建新的实验时,会有一堆文件在autoweka运行之前和运行期间生成。对于每个实验,“实验”文件夹中都会有一个新文件夹。如果在构造函数中指定了该文件夹,则该文件夹将具有实验的名称。每次安装数据时,都会创建一个tempraroy arff文件,其中包含所有数据。此文件将在“fit”调用后被删除。
安装转到项目源并安装:
```
git clone git@github.com:tdomhan/py autoweka.git
cd pyautoweka
python setup.py install
```
=pyautoweka.experiment(tuner_timeout=9000)
````
`tuner_timeout`是优化运行的时间(秒)。例如9000秒=2.5小时。运行优化的时间越长,当然就越好。(注意,“experiment”对象有一个类似于sklearn分类器的接口。)
首先我们需要加载一些数据。例如著名的[iris数据集](http://archive.ics.uci.edu/ml/dataset s/iris)。使用[这个链接](http://archive.ics.uci.edu/ml/machine learning databases/iris/iris/iris.data)下载它。我们把它加载到python中去吧:
``python
``加载数据:
import numpy as np
import ranrandom
y=y=y=np.loadtxt.load是的
洗牌数据:
index=range(len(x))
随机洗牌(index)
x=x[index]
y=y[index]
洗牌(index)
x=x[0:100]
y=y[0:100]
x=x[0:100]
x=x[0:100]
y=y[0:100]
x=x[100]
y=y[100]
y=y[100]
x=y=y[100]
并预测延迟数据的标签:
y嫒predict=experiment.predict(x嫒test)
y嫒predict=experiment.num嫒correct=sum([1表示预测,如果预测=correct,则在zip(y嫒predict,y嫒test)中正确])
打印“精度:%f%float(num嫒correct)/len(y嫒test)
`
精度高达90%s.
高级:选择特定分类器
当您不设置特定分类器时,将尝试所有可用的分类器。您可以选择将搜索限制为某些分类器,如下所示:
分类器:
``python
experience.add_classifier(“weka.classifiers.functions.simplelogistic”)
````
advanced:创建的文件在创建新的实验时,会有一堆文件在autoweka运行之前和运行期间生成。对于每个实验,“实验”文件夹中都会有一个新文件夹。如果在构造函数中指定了该文件夹,则该文件夹将具有实验的名称。每次安装数据时,都会创建一个tempraroy arff文件,其中包含所有数据。此文件将在“fit”调用后被删除。