我能为sklearn-SVM显式地设置可能的类列表吗？

# Python 2.7.6 from sklearn.svm import SVC from sklearn.multiclass import OneVsRestClassifier import numpy as np X_train = [[1], [2], [4]] * 10 y = [1, 2, 4] * 10 X_test = [[1]] clf = OneVsRestClassifier(SVC(probability=True, kernel="linear")) clf.fit(X_train, y) # calling predict_proba() gives: [p(1) p(2) p(4)] # I want: [p(1) p(2) p(3) p(4)], where p(3) = 0 print clf.predict_proba(X_test)

1条回答

网友

1楼 · 发布于 2024-04-25 08:07:38

正如评论中所说，scikitlearn没有提供显式设置可能的类标签的方法。在

我把你的解决办法搞砸了：

import sklearn
import sklearn.svm
import numpy as np
np.random.seed(3) # for reproducibility

def predict_proba_ordered(probs, classes_, all_classes):
    """
    probs: list of probabilities, output of predict_proba 
    classes_: clf.classes_
    all_classes: all possible classes (superset of classes_)
    """
    proba_ordered = np.zeros((probs.shape[0], all_classes.size),  dtype=np.float)
    sorter = np.argsort(all_classes) # http://stackoverflow.com/a/32191125/395857
    idx = sorter[np.searchsorted(all_classes, classes_, sorter=sorter)]
    proba_ordered[:, idx] = probs
    return proba_ordered

# Prepare the data set
all_classes = np.array([1,2,3,4]) # explicitly set the possible class labels.
X_train = [[1], [2], [4]] * 3
print('X_train: {0}'.format(X_train))
y = [1, 2, 4] * 3 # Label 3 is missing.
print('y: {0}'.format(y))
X_test = [[1], [2], [3]]
print('X_test: {0}'.format(X_test))

# Train
clf = sklearn.svm.SVC(probability=True, kernel="linear")
clf.fit(X_train, y)
print('clf.classes_: {0}'.format(clf.classes_))

# Predict
probs = clf.predict_proba(X_test) #As label 3 isn't in train set, the probs' size is 3, not 4
proba_ordered = predict_proba_ordered(probs, clf.classes_, all_classes)
print('proba_ordered: {0}'.format(proba_ordered))

输出：

^{pr2}$

请注意，您可以使用labels参数显式地设置sklearn.metrics中可能的类标签（例如^{}）：

labels : array
Integer array of labels.

示例：

# Score
y_pred = clf.predict(X_test)
y_true = np.array([1,2,3])
precision = sklearn.metrics.precision_score(y_true, y_pred, labels=all_classes, average=None)
print('precision: {0}'.format(precision))
recall = sklearn.metrics.recall_score(y_true, y_pred, labels=all_classes, average=None)
print('recall: {0}'.format(recall))
f1_score = sklearn.metrics.f1_score(y_true, y_pred, labels=all_classes, average=None)
print('f1_score: {0}'.format(f1_score))

请注意，从现在起您将run into issue issue try using ^{} when no positive example is in the ground truth for a given label 。在

相关问题更多 >

编程相关推荐

热门问题

热门文章