Scikit learn cross val score:数组索引太多

from sklearn.ensemble import ExtraTreesClassifier from sklearn.cross_validation import cross_val_score #split the dataset for train and test combnum['is_train'] = np.random.uniform(0, 1, len(combnum)) <= .75 train, test = combnum[combnum['is_train']==True], combnum[combnum['is_train']==False] et = ExtraTreesClassifier(n_estimators=200, max_depth=None, min_samples_split=10, random_state=0) min_samples_split=10, random_state=0 ) labels = train[list(label_columns)].values tlabels = test[list(label_columns)].values features = train[list(columns)].values tfeatures = test[list(columns)].values et_score = cross_val_score(et, features, labels, n_jobs=-1) print("{0} -> ET: {1})".format(label_columns, et_score))

Out[21]: array([[ 0., 1., 1., ..., 0., 0., 1.], [ 0., 1., 1., ..., 0., 0., 1.], [ 1., 1., 1., ..., 0., 0., 1.], ..., [ 0., 0., 1., ..., 0., 0., 1.], [ 0., 0., 1., ..., 0., 0., 1.], [ 0., 0., 1., ..., 0., 0., 1.]])

3条回答

网友

1楼 · 编辑于 2024-05-12 17:38:05

向传递到公式中的Y/Labels变量添加.ravel()也有助于在KNN中解决此问题。

网友

2楼 · 编辑于 2024-05-12 17:38:05

如果将目标标签指定为来自Pandas的单个数据列，则它似乎是可以修复的。如果目标有多个列，我会得到一个类似的错误。例如，尝试：

labels = train['Y']

网友

3楼 · 编辑于 2024-05-12 17:38:05

在scikit learn中进行交叉验证时，该过程需要一个(R,)形状标签，而不是(R,1)。虽然它们在某种程度上是相同的，但是它们的索引机制是不同的。所以在你的例子中，只需加上：

c, r = labels.shape
labels = labels.reshape(c,)

在传递给交叉验证函数之前。

相关问题更多 >

编程相关推荐

热门问题

热门文章