机器学习工具
milk的Python项目详细描述
========
milk:machine learning toolkit
==========
python中的machine learning
----
milk是python中的machine learning toolkit。
随机森林,决策树。它还执行
功能选择这些分类器可以以多种方式进行组合,形成不同的分类系统。BR/> BR/>用于无监督学习,牛奶支持k-均值聚类和亲和度BR/>传播。它针对numpy数组进行了优化,但通常可以处理任何事情(例如,对于svms,您可以使用任何数据类型和任何内核
,并且它做了正确的事情)。
因此,大多数的BR/>性能敏感代码是C++的。为了方便起见,这是基于Python的
接口背后的原因。
要了解更多信息,请查看http://packages.Python.org/milk/
<;http://packages.Python.org/milk/>上的文档;`或者源代码中包含的代码演示:``milk/demos/`.
示例
--
这里是如何测试对某些``features,labels``data,
进行交叉验证时的分类情况:
import numpy as np
import milk
features=np.rand(100,10)二维特征数组:10个特征的100个例子,每个
标签=np.zeros(100)
特征[50:]+=.5
标签[50:]=1
混淆矩阵,名称=milk.nfoldcrossValidation(特征,标签)
打印“精度:”,混淆矩阵.trace()/float(混淆矩阵.sum())
你实例化一个*learner对象*并调用它的
``train()``方法::
import numpy as np
import milk
features=np.rand(100,10)
labels=np.zeros(100)
features[50:]+=.5
labels[50:]=1
learner=milk.defaultclassifier()
model=learner.train(features标签)
但它们都使用同一个接口:``train()``返回一个*model*对象,该对象有一个``apply()``
方法在新实例上执行。
details
----
license:mit
author:luis pedro coelho(代码来自libsvm和scikits.learn)
api文档:`http://packages.python.org/milk/<;http://packages.python.org/milk/>;`
使用libsvm解算器和pythonesque包装器。
-套索
-k-意味着使用尽可能少的内存。它可以有效地对数百万个
实例进行聚类。
-随机林
-自组织映射
-特征选择的逐步判别分析。
-非负矩阵分解
-关联传播
0.6.1版(2015年5月11日)0.6.1(2015年5月11日)0.6(2015年5月11日)0.6(2015年4月27日)0.6(2015年4月27日)0.6(2015年4月27日)0.6(2015年4月27日)0.6.6(2015年4月27日)0.5.3(2013年6月19日)0.5.3(2013年6月19日)0.5.3(2013年6月19日)0.3(2013年6.3)0.3(2013年5.5.3(2013年6月19日)0.5.3(2013年0.5.5.3)0.3(2013年0.5.5.3(2013年0.3)0.~~~
-修复非数组输入的MDS
-修复MDS错误
-将返回参数添加到kmeans
-扩展ZcSeRe()在非NDARIORE
-添加FracePrxPultStultReals
-与旧的C++编译器一起工作
BR/> BR/>新in 0.5.2(7 MAR 2013)
~~~~~~~~~~~~~~~~~~~
-用SO固定特征本构。新的0.5.1版本(2013年1月11日)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~>-添加子空间投影knnn
-导出牛奶名称空间中的“pdist”列表``in牛奶名称空间
-添加特征到源分布
-添加度量值。曲线。roc
-roc
-添加“mds”dists``函数
-添加“verbose”参数到牛奶中。添加“verbose``参数。牛奶。牛奶。牛奶。牛奶。测试。运行
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-添加基于坐标下降的套索
-添加无监督的中心函数
-使zscore与nans一起工作(忽略它们)
-通过transformers传播apply-many调用
-更快的SVM分类意味着更快的DefaultLearner()
[在酵母数据集上测量到2.5倍的加速!]
有关旧版本,请参见“ChangeLog”文件
milk:machine learning toolkit
==========
python中的machine learning
----
milk是python中的machine learning toolkit。
随机森林,决策树。它还执行
功能选择这些分类器可以以多种方式进行组合,形成不同的分类系统。BR/> BR/>用于无监督学习,牛奶支持k-均值聚类和亲和度BR/>传播。它针对numpy数组进行了优化,但通常可以处理任何事情(例如,对于svms,您可以使用任何数据类型和任何内核
,并且它做了正确的事情)。
因此,大多数的BR/>性能敏感代码是C++的。为了方便起见,这是基于Python的
接口背后的原因。
要了解更多信息,请查看http://packages.Python.org/milk/
<;http://packages.Python.org/milk/>上的文档;`或者源代码中包含的代码演示:``milk/demos/`.
示例
--
这里是如何测试对某些``features,labels``data,
进行交叉验证时的分类情况:
import numpy as np
import milk
features=np.rand(100,10)二维特征数组:10个特征的100个例子,每个
标签=np.zeros(100)
特征[50:]+=.5
标签[50:]=1
混淆矩阵,名称=milk.nfoldcrossValidation(特征,标签)
打印“精度:”,混淆矩阵.trace()/float(混淆矩阵.sum())
你实例化一个*learner对象*并调用它的
``train()``方法::
import numpy as np
import milk
features=np.rand(100,10)
labels=np.zeros(100)
features[50:]+=.5
labels[50:]=1
learner=milk.defaultclassifier()
model=learner.train(features标签)
但它们都使用同一个接口:``train()``返回一个*model*对象,该对象有一个``apply()``
方法在新实例上执行。
details
----
license:mit
author:luis pedro coelho(代码来自libsvm和scikits.learn)
api文档:`http://packages.python.org/milk/<;http://packages.python.org/milk/>;`
使用libsvm解算器和pythonesque包装器。
-套索
-k-意味着使用尽可能少的内存。它可以有效地对数百万个
实例进行聚类。
-随机林
-自组织映射
-特征选择的逐步判别分析。
-非负矩阵分解
-关联传播
0.6.1版(2015年5月11日)0.6.1(2015年5月11日)0.6(2015年5月11日)0.6(2015年4月27日)0.6(2015年4月27日)0.6(2015年4月27日)0.6(2015年4月27日)0.6.6(2015年4月27日)0.5.3(2013年6月19日)0.5.3(2013年6月19日)0.5.3(2013年6月19日)0.3(2013年6.3)0.3(2013年5.5.3(2013年6月19日)0.5.3(2013年0.5.5.3)0.3(2013年0.5.5.3(2013年0.3)0.~~~
-修复非数组输入的MDS
-修复MDS错误
-将返回参数添加到kmeans
-扩展ZcSeRe()在非NDARIORE
-添加FracePrxPultStultReals
-与旧的C++编译器一起工作
BR/> BR/>新in 0.5.2(7 MAR 2013)
~~~~~~~~~~~~~~~~~~~
-用SO固定特征本构。新的0.5.1版本(2013年1月11日)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~>-添加子空间投影knnn
-导出牛奶名称空间中的“pdist”列表``in牛奶名称空间
-添加特征到源分布
-添加度量值。曲线。roc
-roc
-添加“mds”dists``函数
-添加“verbose”参数到牛奶中。添加“verbose``参数。牛奶。牛奶。牛奶。牛奶。测试。运行
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-添加基于坐标下降的套索
-添加无监督的中心函数
-使zscore与nans一起工作(忽略它们)
-通过transformers传播apply-many调用
-更快的SVM分类意味着更快的DefaultLearner()
[在酵母数据集上测量到2.5倍的加速!]
有关旧版本,请参见“ChangeLog”文件