我需要帮助通过Python中的KMeans方法找到所有可能的集群。为简单起见,假设我有下表:
身高|体重|原产国(X/Y/Z)|国旗(1/0)
一张n_人x 4号的桌子
我人为地插入了这些数据,以便在两种不同的聚类中做出选择
现在使用Kmeans“我发现”所有身高超过180厘米的人都来自X国
这是找到第一个聚类的代码(所有身高超过180厘米的人都来自X国):
df = pd.read_csv('survey.csv')
x = df.iloc[:, :].values
kmeans2 = KMeans(n_clusters=2)
y_kmeans2 = kmeans2.fit_predict(x)
但我也知道所有小于170厘米的人的flag变量都等于0
有没有一种方法可以通过“忽略”上一个集群来找到这个集群?通过排除第三列(原产国)重新定义x
有意义吗
感谢所有愿意回答的人
目前没有回答
相关问题 更多 >
编程相关推荐