plt.散射（）：由于“c”参数，ValueError

k = 5 df = pd.read_csv('data_latlong.csv') lat = df['Lat'].values long = df['Long'].values X = np.matrix(list(zip(lat, long))) kmeans = KMeans(n_clusters=k).fit(X) plt.figure(figsize=(10, 10)) plt.scatter(X[:, 0], X[:, 1], c=kmeans.labels_) plt.title("n = 5") plt.show()

1条回答

网友

1楼 · 发布于 2024-06-08 16:26:52

TL；DR：试试c=kmeans.labels_.reshape(kmeans.labels_.shape[0])。这将把标签从（3909,1）数组转换为（3909,1）向量。你知道吗

你在sklearn“iris”数据集上所做的一切对我很有用：

from sklearn import datasets
from sklearn.cluster import KMeans
from matplotlib import pyplot as plt

irises = datasets.load_iris()
X = irises['data']
clust = KMeans(n_clusters=3).fit(X)

plt.figure(figsize=(10, 10))
plt.scatter(X[:, 0], X[:, 1], c=clust.labels_)

print(X.shape)             # (150, 4)
print(clust.labels_.shape) # (150,)

注意，我的clust.labels_是一个（150，）向量。相反，如果我将其重塑为a（150,1）并尝试传递它，我会得到与您相同的错误：

c_bad = clust.labels_.reshape((150,1))
plt.scatter(X[:, 0], X[:, 1], c=c_bad) # fails

所以我想我们有不同版本的sklearn，我的标签放在向量中，而你的标签放在数组中。解决方法是反其道而行之，并尝试将标签从数组重塑为向量：

plt.scatter(X[:, 0], X[:, 1], c=kmeans.labels_.reshape(3909))

另请参见

This answer
和this bug report。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章