找到所有可能的聚类

2024-06-17 08:41:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要帮助通过Python中的KMeans方法找到所有可能的集群。为简单起见,假设我有下表:

身高|体重|原产国(X/Y/Z)|国旗(1/0)

一张n_人x 4号的桌子

我人为地插入了这些数据,以便在两种不同的聚类中做出选择

现在使用Kmeans“我发现”所有身高超过180厘米的人都来自X国

这是找到第一个聚类的代码(所有身高超过180厘米的人都来自X国):

df = pd.read_csv('survey.csv')
x = df.iloc[:, :].values
kmeans2 = KMeans(n_clusters=2)
y_kmeans2 = kmeans2.fit_predict(x)

但我也知道所有小于170厘米的人的flag变量都等于0

有没有一种方法可以通过“忽略”上一个集群来找到这个集群?通过排除第三列(原产国)重新定义x有意义吗

感谢所有愿意回答的人


Tags: csv数据方法代码df集群聚类kmeans