SKLearn ValueError: 设定数组元素时出现重复

import pandas as pd import numpy as np import random from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import confusion_matrix trainingData = [[[0, 0, 3], 0.77], [[24, 0, 5], 30], [[0, 0, 4], 0.77], [[0, 0, 0], 0.77]] vectors_train = [] for i in range (0, len(trainingData)): vectors_train.append(trainingData[i][0]) testingData = [[[1, 0, 0], 0.77], [[30, 0, 5], 30], [[0, 0, 0], 0.77], [[0, 0, 0], 0.77]] vectors_test = [] for i in range (0, len(testingData)): vectors_test.append(testingData[i][0]) dataframe_training = pd.DataFrame(trainingData) dataframe_training['is_train'] = True dataframe_testing = pd.DataFrame(testingData) dataframe_testing['is_train'] = False frames = [dataframe_training, dataframe_testing] dataframe = pd.concat(frames) dataframe.rename(index = str, columns = {0: 'Vector', 1: 'Label', 2: 'is_train'}) train, test = dataframe[dataframe['is_train']==True], dataframe[dataframe['is_train']==False] features = dataframe.columns[:1] labels_train, uniques = pd.factorize(train[1], sort = True) clf = RandomForestClassifier() clf.fit(train[features], labels) # Value error occurs here

2条回答

网友

1楼 · 编辑于 2024-04-20 10:11:41

出现此错误是因为调用fit方法时数据格式不正确。您的输入是list的DataFrame（只有一列），但是fit方法需要numpy数组。你知道吗

如果你这样做，它应该会起作用：

X = np.array(train[features][0].tolist())
clf.fit(X, labels_train)

所以X是一个有4个例子的数组，每个例子有3个特征。你知道吗

网友

2楼 · 编辑于 2024-04-20 10:11:41

删除features变量并生成最后一行：

clf.fit(train[0].tolist(), labels)

上面的代码没有出现错误。你知道吗

但是，{int}和cd6一样，因为它不需要使用cd5。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章