使用机器学习算法的简单高级库
pylearning的Python项目详细描述
##pylearning:python机器学习库
[![许可证](https://img.shields.io/github/license/mashape/apistatus.svg?maxage=2592000)(https://github.com/amstuta/pylearning/blob/master/license.md)
[![pypi](https://img.shields.io/pypi/pyversions/pylearning.svg)](
pylearning是一个高级机器学习软件包,设计用于轻松创建
原型并实现数据分析程序。
该库包括以下算法:
-回归:
-决策树回归
-随机森林回归
-最近邻回归器
-分类:
-决策树分类器
-随机森林分类器
-最近邻分类器
-聚类:
-k-均值
-dbscan(基于密度的聚类)
时尚。
此软件包与python3+兼容。
数据集
特征,目标=…
rf=随机森林回归(nb_树=10,nb_样本=100,最大深度=20)
rf.fit(特征,目标)
加载测试样本
测试特征,测试目标=…
预测值=rf.predict(测试特征,测试目标)使用dbscan算法的聚类示例=dbscan(epsilon=0.2)
cl.fit(data)
labels\u data={i:([],[])for i in range(-1,2)}
for ex,label in zip(data,cl.labels):
labels\u data[label][0].append(ex[0])
labels\u data[label][1].append(ex[1])
colors=['g','b']
for label,label_data.items()中的值:
如果label=-1:
plt.scatter(值[0],值[1],color=-black')
否则:
plt.scatter(值[0],值[1],color=color s[label],s=50)
plt.show()
````
![替换文本](resources/dbscan.png?raw=true)
API的完整文档[此处](https://pylearning.arthuramstutz.com/)。
\pylearning需要安装numpy。它可以简单地使用pypy进行安装:对于稳定版本,pip3安装pylearning;对于最新版本,pip3安装git+https://github.com/amstuta/pylearning.git;进一步改进,不同算法的核心功能在本项目中实现。但是有许多可能的改进:
-分割节点(决策树)的gini标准
-修剪(决策树)
-将节点分割为任意数量的子节点(决策树)的能力
-减少时间和内存消耗的优化
-与pandas数据帧的更好兼容性
-添加新算法(基于密度的聚类、支持向量机、神经网络等)
若要执行此操作,您只需打开问题或分叉项目,然后创建拉取请求即可。
[![许可证](https://img.shields.io/github/license/mashape/apistatus.svg?maxage=2592000)(https://github.com/amstuta/pylearning/blob/master/license.md)
[![pypi](https://img.shields.io/pypi/pyversions/pylearning.svg)](
pylearning是一个高级机器学习软件包,设计用于轻松创建
原型并实现数据分析程序。
该库包括以下算法:
-回归:
-决策树回归
-随机森林回归
-最近邻回归器
-分类:
-决策树分类器
-随机森林分类器
-最近邻分类器
-聚类:
-k-均值
-dbscan(基于密度的聚类)
时尚。
此软件包与python3+兼容。
数据集
特征,目标=…
rf=随机森林回归(nb_树=10,nb_样本=100,最大深度=20)
rf.fit(特征,目标)
加载测试样本
测试特征,测试目标=…
预测值=rf.predict(测试特征,测试目标)使用dbscan算法的聚类示例=dbscan(epsilon=0.2)
cl.fit(data)
labels\u data={i:([],[])for i in range(-1,2)}
for ex,label in zip(data,cl.labels):
labels\u data[label][0].append(ex[0])
labels\u data[label][1].append(ex[1])
colors=['g','b']
for label,label_data.items()中的值:
如果label=-1:
plt.scatter(值[0],值[1],color=-black')
否则:
plt.scatter(值[0],值[1],color=color s[label],s=50)
plt.show()
````
![替换文本](resources/dbscan.png?raw=true)
API的完整文档[此处](https://pylearning.arthuramstutz.com/)。
\pylearning需要安装numpy。它可以简单地使用pypy进行安装:对于稳定版本,pip3安装pylearning;对于最新版本,pip3安装git+https://github.com/amstuta/pylearning.git;进一步改进,不同算法的核心功能在本项目中实现。但是有许多可能的改进:
-分割节点(决策树)的gini标准
-修剪(决策树)
-将节点分割为任意数量的子节点(决策树)的能力
-减少时间和内存消耗的优化
-与pandas数据帧的更好兼容性
-添加新算法(基于密度的聚类、支持向量机、神经网络等)
若要执行此操作,您只需打开问题或分叉项目,然后创建拉取请求即可。