特征聚集：如何检索构成簇的特征？

from sklearn import cluster import pandas as pd #load the data df = pd.read_csv('C:/Documents/data.csv') agglo = cluster.FeatureAgglomeration(n_clusters=5) agglo.fit(df) df_reduced = agglo.transform(df)

2条回答

网友

1楼 · 编辑于 2024-06-11 16:20:55

在对cluster进行拟合之后，agglo.labels_包含一个列表，该列表告诉原始数据集中的每个特征属于哪个集群。在

网友

2楼 · 编辑于 2024-06-11 16:20:55

在转换过程中，每个簇中的特征如何组合的方式由执行层次聚类的方式来设置。简化后的特征集由n个簇的簇中心（即n个样本-维向量）组成。对于某些应用程序，您可能会认为计算中心使用不同的集群中心定义（即中值而不是平均值，以避免异常值的影响等）。在

n_features = 15
feature_identifier = range(n_features)
feature_groups = [np.array(feature_identifier )[agglo.labels_==i] for i in range(n_clusters)]
new_features = [df.loc[:,df.keys()[group]].mean(0) for group in feature_groups]

不要忘记预先标准化这些特性（例如使用sklearn的scaler）。否则，您宁愿对数量的比例进行分组，而不是对类似行为进行聚类。希望有帮助！还没有测试代码。如果有问题请告诉我。在

相关问题更多 >

编程相关推荐

热门问题

热门文章