使用机器学习算法的简单高级库

pylearning的Python项目详细描述


##pylearning:python机器学习库

[![许可证](https://img.shields.io/github/license/mashape/apistatus.svg?maxage=2592000)(https://github.com/amstuta/pylearning/blob/master/license.md)
[![pypi](https://img.shields.io/pypi/pyversions/pylearning.svg)](


pylearning是一个高级机器学习软件包,设计用于轻松创建
原型并实现数据分析程序。


该库包括以下算法:
-回归:
-决策树回归
-随机森林回归
-最近邻回归器
-分类:
-决策树分类器
-随机森林分类器
-最近邻分类器
-聚类:
-k-均值
-dbscan(基于密度的聚类)

时尚。
此软件包与python3+兼容。


数据集
特征,目标=…

rf=随机森林回归(nb_树=10,nb_样本=100,最大深度=20)
rf.fit(特征,目标)

加载测试样本
测试特征,测试目标=…

预测值=rf.predict(测试特征,测试目标)使用dbscan算法的聚类示例=dbscan(epsilon=0.2)
cl.fit(data)

labels\u data={i:([],[])for i in range(-1,2)}
for ex,label in zip(data,cl.labels):
labels\u data[label][0].append(ex[0])
labels\u data[label][1].append(ex[1])

colors=['g','b']
for label,label_data.items()中的值:
如果label=-1:
plt.scatter(值[0],值[1],color=-black')
否则:
plt.scatter(值[0],值[1],color=color s[label],s=50)

plt.show()
````

![替换文本](resources/dbscan.png?raw=true)

API的完整文档[此处](https://pylearning.arthuramstutz.com/)。

\pylearning需要安装numpy。它可以简单地使用pypy进行安装:对于稳定版本,pip3安装pylearning;对于最新版本,pip3安装git+https://github.com/amstuta/pylearning.git;进一步改进,不同算法的核心功能在本项目中实现。但是有许多可能的改进:
-分割节点(决策树)的gini标准
-修剪(决策树)
-将节点分割为任意数量的子节点(决策树)的能力
-减少时间和内存消耗的优化
-与pandas数据帧的更好兼容性
-添加新算法(基于密度的聚类、支持向量机、神经网络等)


若要执行此操作,您只需打开问题或分叉项目,然后创建拉取请求即可。




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Springboot数据JPA findByDate()   java是否可以有多个顶级树节点?   javahibernatehql。子查询中的多个   使用Twilio验证java Keyclope电话号码   java重写对象的toString()表示返回意外的符号   java Android最多每15分钟调用一个方法,否则使用保存的数据   在java swing中突出显示jeditorpane中的一些单词   java将时间戳转换为UTC时区   由于main中存在ArrayIndexOutOfBoundsException,导致java编译错误   java如何通过requestscope获取对象内部对象的值?   java访问安卓代码内的网站并检索生成的图像   java这种日期格式的模式是什么?   java解析包含超链接的xml字符串