我如何知道每个分类功能的性能

2024-04-24 11:16:22 发布

您现在位置:Python中文网/ 问答频道 /正文

from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)

from sklearn.linear_model import LogisticRegression
lr.fit(X_train, y_train)

print(metrics.accuracy_score(y_test, y_pred)) 

我正在用logistic回归建立一个模型在我的训练数据中我有三个特征一个特征是分类特征(例如颜色:蓝色,红色,绿色)。我转换成虚拟变量并建立模型。我想知道每种类型的性能-绿色-红色-蓝色,而不是整个


Tags: from模型testimportsizetrainrandom特征
1条回答
网友
1楼 · 发布于 2024-04-24 11:16:22

假设存储分类数据的特性位于第一列,因此索引0。您可以从X_test中提取与每个类别相关联的数据,如下所示

col = 0
for i in set(X_test[:,col]):
    ixs = X_test[:,col] == i
    print('Category ' + str(i) + ': ') 
    print(metrics.accuracy_score(X_test[ixs], y_test[ixs])) 

这将为您提供第1列中每个类别的准确度。你知道吗

相关问题 更多 >