from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
from sklearn.linear_model import LogisticRegression
lr.fit(X_train, y_train)
print(metrics.accuracy_score(y_test, y_pred))
我正在用logistic回归建立一个模型在我的训练数据中我有三个特征一个特征是分类特征(例如颜色:蓝色,红色,绿色)。我转换成虚拟变量并建立模型。我想知道每种类型的性能-绿色-红色-蓝色,而不是整个
假设存储分类数据的特性位于第一列,因此索引
0
。您可以从X_test
中提取与每个类别相关联的数据,如下所示这将为您提供第1列中每个类别的准确度。你知道吗
相关问题 更多 >
编程相关推荐