存储群集结果

2024-04-25 21:43:03 发布

男 | 程序猿一只，喜欢编程写python代码。

考虑到我的熊猫df，我对相关矩阵进行分层聚类，如下所示：

import scipy.cluster.hierarchy as sch

X = df.corr().values
d = sch.distance.pdist(X) 
L = sch.linkage(d, method='complete')
C = sch.fcluster(L, 0.5*d.max(), 'distance')

我需要帮助执行以下简单的任务。我想要一个有两列的新的df_res：（1）变量的名称，由我原来的df列给出，（2）基于C中的结果它所属的集群。比如：

VAR     CLUSTER
var_1   1
var_2   2
var_3   1
var_4   1
var_5   2

提前谢谢！你知道吗

Tags： import df hierarchy var 分层 as 聚类 scipy

1条回答

网友

1楼 · 发布于 2024-04-25 21:43:03

您可以像这样创建所需的数据帧

df_res = pd.DataFrame([{'VAR': x, 'CLUSTER': y} for (x,y) in zip(df.columns, C)])

存储群集结果

相关问题更多 >

编程相关推荐

热门问题

热门文章

存储群集结果

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >