使用数组.重塑（1，1）如果您的数据只有一个特征

import pandas as pd import numpy as np from sklearn.metrics import pairwise_distances from sklearn import cluster, datasets, preprocessing, metrics from sklearn.cluster import KMeans df = pd.read_csv("master.csv") labels = list(df['Q3 Theme1']) labels_reshaped = np.ndarray(labels).reshape(-1,1) X = open('entire_dataset__resnet50_feature_vectors.txt') X_Data = X.read() print('Silhouette Score:', metrics.silhouette_score(X_Data, labels_reshaped, metric='cosine'))

import pandas as pd import numpy as np from sklearn.metrics import pairwise_distances from sklearn import cluster, datasets, preprocessing, metrics from sklearn.cluster import KMeans df = pd.read_csv("master.csv") labels = list(df['Q3 Theme1']) labels_reshaped = np.ndarray(labels).reshape(1,-1) X = open('entire_dataset__resnet50_feature_vectors.txt') X_Data = X.read() print('Silhouette Score:', metrics.silhouette_score(X_Data, labels_reshaped, metric='cosine'))

Traceback (most recent call last): File "/dataset/silouhette_score.py", line 8, in <module> labels_reshaped = np.ndarray(labels).reshape(1,-1) ValueError: sequence too large; cannot be greater than 32 Process finished with exit code 1

import pandas as pd from sklearn import metrics df = pd.read_csv("master.csv") labels = list(df['Q3 Theme1']) X = open('entire_dataset__resnet50_feature_vectors.txt') X_Data = X.read() print('Silhouette Score:', metrics.silhouette_score(X_Data, labels, metric='cosine'))

1条回答

网友

1楼 · 发布于 2024-05-15 13:24:52

我终于弄明白了。我需要创建与sklearn所需格式相同的特征向量：

import pandas as pd
from sklearn import metrics


df = pd.read_csv("master.csv")
labels = list(df['Q3 Theme1'])
X = open('entire_dataset__resnet50_feature_vectors.txt')
#X_Data = X.read()

fv = []
for line in X:
    line = line.strip("\n")
    tmp_arr = line.split(' ')
    print(tmp_arr)
    fv.append(tmp_arr)

print(fv)
print('Silhouette Score:', metrics.silhouette_score(fv, labels,
                                                    metric='cosine'))

相关问题更多 >

编程相关推荐

热门问题

热门文章