找到所有可能的聚类

2024-06-17 08:41:18 发布

男 | 程序猿一只，喜欢编程写python代码。

我需要帮助通过Python中的KMeans方法找到所有可能的集群。为简单起见，假设我有下表：

身高|体重|原产国（X/Y/Z）|国旗（1/0）

一张n_人x 4号的桌子

我人为地插入了这些数据，以便在两种不同的聚类中做出选择

现在使用Kmeans“我发现”所有身高超过180厘米的人都来自X国

这是找到第一个聚类的代码（所有身高超过180厘米的人都来自X国）：

df = pd.read_csv('survey.csv')
x = df.iloc[:, :].values
kmeans2 = KMeans(n_clusters=2)
y_kmeans2 = kmeans2.fit_predict(x)

但我也知道所有小于170厘米的人的flag变量都等于0

有没有一种方法可以通过“忽略”上一个集群来找到这个集群？通过排除第三列（原产国）重新定义x有意义吗

感谢所有愿意回答的人

Tags： csv 数据方法代码 df 集群聚类 kmeans

0条回答

目前没有回答