集成群集的简易界面
flexible-clustering-tree的Python项目详细描述
柔性聚类树< BR/><*BR/> BR/>在**聚类**任务的上下文中,'''灵活聚类树''BR/>提供了*****和**可控**聚类框架。
BR/>图::https://user images.githubusercontent.com/1772712/47308081-9980cd00-d66b-11e8-98c0-a275db021cd7.gif
:alt:
background
===
假设您有大量数据。您希望尽可能容易地观察到数据。
分层聚类是查看聚类树的一种方法但是,
层次聚类往往会陷入局部优化。
因此,您需要其他聚类方法。但同时,你想用树结构风格来观察数据。
BR/>这里,“灵活的聚类树”可以让你从数据
到树查看器(D3)的简单方法
BR/>你可以设置任何类型的聚类算法,如KMead,DbSCAN,
谱聚类。
多特征多聚类
在生成树时,您可能需要使用各种聚类
算法。例如,将kmeans用于树的第一个后一层,将dbscan用于树的第二层。
,还可以根据树的层使用各种类型的特征。例如,在文档聚类的上下文中,第一层是新闻标题,第二层是全文。
word2vec
模型。
-第二层(蓝色高亮)用kmeans完成,特征是稀疏的全文向量(bow)。
…图::http://用户图像.GithuBuffelCyp.com/1772712 /47 308468ABAF3B00 -D66 C-11E89A0826FACC9E80E.PNG
:ALT:BR/>
两种都有可能的“灵活聚类树”!
贡献
==
-从数据(特征矩阵)到树查看器的简单界面(scikit学习方式)
-可以使各种聚类算法集成
-可以设置各种特征类型
如何使用?
==
…代码::Python BR/> BR/>从FixiLuxCultStutyType导入特征MasReXObjor,多特征MyRIXObjultBR/>从FixiLuxCultStutyJoin导入聚类运算符,多个LUBLUTION运算符BR/>从FuffiLeLuxCultGuang-Type导入FuffiLeCultBys
BR/>集合特征矩阵< BR/> FyObj1=TrimeMatrix对象(0,rand(500,600))
f_obj_2nd=FeatureMatrixObject(1,numpy.random.rand(500,300))
f_obj_3rd=FeatureMatrixObject(2,numpy.ran随机rand(500,50))
f_obj_3rd=FeatureMatrixObject(2,numpy.rand.rand(500,50))
dict_indexx2标签{i:“label-{}”,format(i)i)i i i i i i i in ranranranranrange(0,500)}
br/>multi_feature matrix=MultiFeatureMatrixObject=multi第二个目标f_obj戋u 3rd],
dict戋u index2label=dict戋u index2label
第5())<(=),运行的是灵活的集群,< = >(= 3),multi_clustering)
html=clustering_runner.clustering_tree.to_html()
代码::bash
BR/> PIP安装柔性树> BR/> BR/>或关闭此存储库
BR/>。代码::bash
这里有一个简单的
过程,
1。建立docker镜像
2。启动docker容器
3在容器中运行测试。代码::BASH
$CD测试:$DOCK组合构建< BR/> $DOCKER组成
$DOCKER运行-名称测试容器-V'PWD':/代码/灵活的聚类树/-DT TestsS.DevEnV.BR/> $DOCKER Excel -IT测试容器Python /代码/灵活的聚类树/Stupp.Py测试
BR/>如果您使用pyTrimy专业版,您可以调用一个
docker compose文件作为Python解释器。
BR/>图::https://user images.githubusercontent.com/1772712/47308081-9980cd00-d66b-11e8-98c0-a275db021cd7.gif
:alt:
background
===
假设您有大量数据。您希望尽可能容易地观察到数据。
分层聚类是查看聚类树的一种方法但是,
层次聚类往往会陷入局部优化。
因此,您需要其他聚类方法。但同时,你想用树结构风格来观察数据。
BR/>这里,“灵活的聚类树”可以让你从数据
到树查看器(D3)的简单方法
BR/>你可以设置任何类型的聚类算法,如KMead,DbSCAN,
谱聚类。
多特征多聚类
在生成树时,您可能需要使用各种聚类
算法。例如,将kmeans用于树的第一个后一层,将dbscan用于树的第二层。
,还可以根据树的层使用各种类型的特征。例如,在文档聚类的上下文中,第一层是新闻标题,第二层是全文。
word2vec
模型。
-第二层(蓝色高亮)用kmeans完成,特征是稀疏的全文向量(bow)。
…图::http://用户图像.GithuBuffelCyp.com/1772712 /47 308468ABAF3B00 -D66 C-11E89A0826FACC9E80E.PNG
:ALT:BR/>
两种都有可能的“灵活聚类树”!
贡献
==
-从数据(特征矩阵)到树查看器的简单界面(scikit学习方式)
-可以使各种聚类算法集成
-可以设置各种特征类型
如何使用?
==
…代码::Python BR/> BR/>从FixiLuxCultStutyType导入特征MasReXObjor,多特征MyRIXObjultBR/>从FixiLuxCultStutyJoin导入聚类运算符,多个LUBLUTION运算符BR/>从FuffiLeLuxCultGuang-Type导入FuffiLeCultBys
BR/>集合特征矩阵< BR/> FyObj1=TrimeMatrix对象(0,rand(500,600))
f_obj_2nd=FeatureMatrixObject(1,numpy.random.rand(500,300))
f_obj_3rd=FeatureMatrixObject(2,numpy.ran随机rand(500,50))
f_obj_3rd=FeatureMatrixObject(2,numpy.rand.rand(500,50))
dict_indexx2标签{i:“label-{}”,format(i)i)i i i i i i i in ranranranranrange(0,500)}
br/>multi_feature matrix=MultiFeatureMatrixObject=multi第二个目标f_obj戋u 3rd],
dict戋u index2label=dict戋u index2label
第5())<(=),运行的是灵活的集群,< = >(= 3),multi_clustering)
html=clustering_runner.clustering_tree.to_html()
代码::bash
BR/> PIP安装柔性树> BR/> BR/>或关闭此存储库
BR/>。代码::bash
这里有一个简单的
过程,
1。建立docker镜像
2。启动docker容器
3在容器中运行测试。代码::BASH
$CD测试:$DOCK组合构建< BR/> $DOCKER组成
$DOCKER运行-名称测试容器-V'PWD':/代码/灵活的聚类树/-DT TestsS.DevEnV.BR/> $DOCKER Excel -IT测试容器Python /代码/灵活的聚类树/Stupp.Py测试
BR/>如果您使用pyTrimy专业版,您可以调用一个
docker compose文件作为Python解释器。