weka数据挖掘库的python包装器。
weka的Python项目详细描述
weka-用于weka分类器的python包装器
概述
提供一个方便的包装器,用于从python调用weka分类器。
安装
首先安装weka和libsvm java库。在debian/ubuntu上,这只是:
sudo apt-get install weka libsvm-java
然后使用pip安装python包:
sudo pip install weka
用法
通过实例化分类器类来训练和测试weka分类器, 传入要使用的分类器的名称:
from weka.classifiers import Classifier
c = Classifier(name='weka.classifiers.lazy.IBk', ckargs={'-K':1})
c.train('training.arff')
predictions = c.predict('query.arff')
或者,可以通过直接调用分类器的名称来实例化该分类器:
from weka.classifiers import IBk
c = IBk(K=1)
c.train('training.arff')
predictions = c.predict('query.arff')
这个实例包含了weka的序列化模型,因此分类器可以很容易地 pickled和unpickle与任何普通的python实例一样:
c.save('myclassifier.pkl')
c = Classifier.load('myclassifier.pkl')
predictions = c.predict('query.arff')
开发
测试需要安装python开发头文件,您可以使用以下命令在ubuntu上安装它们:
sudo apt-get install python-dev python3-dev python3.4-dev
要跨多个python版本运行unittests,请安装:
sudo apt-get install python3.4-minimal python3.4-dev python3.5-minimal python3.5-dev
运行所有tests:
export TESTNAME=; tox
为特定环境(如Python2.7)运行测试:
export TESTNAME=; tox -e py27
运行特定测试:
export TESTNAME=.test_IBk; tox -e py27