存储群集结果

2024-04-25 21:43:03 发布

您现在位置:Python中文网/ 问答频道 /正文

考虑到我的熊猫df,我对相关矩阵进行分层聚类,如下所示:

import scipy.cluster.hierarchy as sch

X = df.corr().values
d = sch.distance.pdist(X) 
L = sch.linkage(d, method='complete')
C = sch.fcluster(L, 0.5*d.max(), 'distance')

我需要帮助执行以下简单的任务。我想要一个有两列的新的df_res:(1)变量的名称,由我原来的df列给出,(2)基于C中的结果它所属的集群。比如:

VAR     CLUSTER
var_1   1
var_2   2
var_3   1
var_4   1
var_5   2

提前谢谢!你知道吗


Tags: importdfhierarchyvar分层as聚类scipy