如何在python中从分层集群中形成的集群创建数据集?

2024-06-16 14:22:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经使用分层集群形成了集群,并希望将这些单独的集群分别存储在一个数据集中以供进一步处理,但我不知道如何做到这一点

Z = linkage(df, 'ward', metric='euclidean')

创建树状图

plt.figure(figsize=(50, 10))
plt.title('Hierarchical Clustering Dendrogram')
plt.xlabel('sample index')
plt.ylabel('distance')
dendrogram(Z, leaf_rotation=90., leaf_font_size=8.,)
plt.show()

Dendrogram

截断簇

plt.title('Hierarchical Clustering Dendrogram (truncated)')
plt.xlabel('sample index or (cluster size)')
plt.ylabel('distance')
dendrogram(Z, truncate_mode='lastp', p=12, leaf_rotation=90., leaf_font_size=12.,)
plt.axhline(y=5000, color='r', linestyle='--')
plt.show()

Truncated Dendrogram

现在我想知道如何分别保存这四个集群,或者如何将它们分开


Tags: samplesizeindextitle集群pltdistanceclustering
1条回答
网友
1楼 · 发布于 2024-06-16 14:22:28

使用任何聚类方法进一步创建聚类

from sklearn.cluster import AgglomerativeClustering
cluster = AgglomerativeClustering(n_clusters=4, affinity='euclidean', linkage='ward')  
cl = cluster.fit_predict(df)

然后将这些集群保存在原始数据帧中

df['Cluster'] = cl

现在,您可以根据集群的值对集群进行排序

相关问题 更多 >