考虑到我的熊猫df
,我对相关矩阵进行分层聚类,如下所示:
import scipy.cluster.hierarchy as sch
X = df.corr().values
d = sch.distance.pdist(X)
L = sch.linkage(d, method='complete')
C = sch.fcluster(L, 0.5*d.max(), 'distance')
我需要帮助执行以下简单的任务。我想要一个有两列的新的df_res
:(1)变量的名称,由我原来的df
列给出,(2)基于C
中的结果它所属的集群。比如:
VAR CLUSTER
var_1 1
var_2 2
var_3 1
var_4 1
var_5 2
提前谢谢!你知道吗
您可以像这样创建所需的数据帧
相关问题 更多 >
编程相关推荐