在二维以上数据上绘制kmeans聚类

from sklearn.preprocessing import StandardScaler scaler = StandardScaler() scaled_features = scaler.fit_transform(psnr_bitrate) kmeans = KMeans(init="random",n_clusters=6,n_init=10,max_iter=300,random_state=42) kmeans.fit(scaled_features) y_kmeans = kmeans.predict(scaled_features)

from sklearn.preprocessing import StandardScaler from sklearn import cluster scaler = StandardScaler() scaled_features = scaler.fit_transform(psnr_bitrate) kmeans = KMeans(init="random",n_clusters=6,n_init=10,max_iter=300,random_state=42) kmeans.fit(scaled_features) y_kmeans = kmeans.predict(scaled_features) scaled_features['cluster'] = y_kmeans pd.tools.plotting.parallel_coordinates(scaled_features, 'cluster')

Traceback (most recent call last): File "<ipython-input-77-2e66d8a57100>", line 7, in <module> scaled_features['cluster'] = y_kmeans IndexError: only integers, slices (`:`), ellipsis (`...`), numpy.newaxis (`None`) and integer or boolean arrays are valid indices

31.764833 35.632833 38.088500 39.877250 41.331917 42.923750 29.832750 34.567500 37.527417 39.621000 41.412583 43.023917 36.777167 41.151333 44.122500 46.237167 47.879083 49.832250 46.871500 52.006333 54.784583 57.099417 58.767833 60.674667

2条回答

网友

1楼 · 编辑于 2024-04-16 19:59:30

在几点上，对于pandas的更高版本，它应该是pd.plotting.parallel_coordinates，如果您将预测器设置为数据帧，则更容易，例如：

import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
from sklearn import datasets
from sklearn.decomposition import PCA

# import some data to play with
X = iris.data
y = iris.target

scaler = StandardScaler()
scaled_features = pd.DataFrame(scaler.fit_transform(X))

如果可以，请提供列名：

scaled_features.columns = iris.feature_names

Kmeans和分配群集：

kmeans = KMeans(init="random",n_clusters=6,n_init=10,max_iter=300,random_state=42)
kmeans.fit(scaled_features)

scaled_features['cluster'] = kmeans.predict(scaled_features)

绘图：

pd.plotting.parallel_coordinates(scaled_features, 'cluster')

或者对特征和绘图进行一些降维：

from sklearn.manifold import MDS
import seaborn as sns

embedding = MDS(n_components=2)
mds = pd.DataFrame(embedding.fit_transform(scaled_features.drop('cluster',axis=1)),
             columns = ['component1','component2'])
mds['cluster'] = kmeans.predict(scaled_features.drop('cluster',axis=1))

sns.scatterplot(data=mds,x = "component1",y="component2",hue="cluster")

网友

2楼 · 编辑于 2024-04-16 19:59:30

scaled_features是一个numpy数组，不能使用字符串对数组进行索引。您需要首先使用以下命令将其转换为数据帧：

scaled_features = pd.DataFrame(scaled_features)

相关问题更多 >

编程相关推荐

热门问题

热门文章