凯拉斯：如何计算多标签分类的准确度？

model = Sequential() model.add(Embedding(10000, 128, input_length=250)) model.add(Flatten()) model.add(Dense(100, activation='relu')) model.add(Dense(len(classes), activation='sigmoid')) model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

2条回答

网友

1楼 · 编辑于 2024-05-14 22:14:06

对于多标签分类，我认为使用sigmoid作为激活，使用binary_crossentropy作为丢失是正确的。

如果输出是稀疏多标签（即少数正标签，多数为负标签），则Kerasaccuracy度量将被正确预测的负标签溢出。如果我没记错的话，凯拉斯不会选择概率最高的标签。相反，对于二进制分类，阈值是50%。所以预测是[0, 0, 0, 0, 0, 1]。如果实际的标签是[0, 0, 0, 0, 0, 0]，那么准确度是5/6。你可以通过建立一个模型来检验这个假设，这个模型总是预测负面标签，并观察其准确性。

如果确实是这样，您可以尝试不同的度量，例如top_k_categorical_accuracy。

我能想到的另一个遥远的可能性是你的训练数据。这些标签是不是“泄露”给了x？只是一个疯狂的猜测。

网友

2楼 · 编辑于 2024-05-14 22:14:06

您可以参考Keras Metrics documentation查看所有可用的度量（例如二进制精度）。您还可以创建自己的自定义度量（并确保它完全符合您的期望）。我想确定neurite关于准确度的计算方法是正确的，所以这就是我所做的（注意：activation="sigmoid"）：

from keras.metrics import binary_accuracy
def custom_acc(y_true, y_pred):
    return binary_accuracy(y_true, y_pred)

# ...

model.compile(loss="binary_crossentropy", optimizer=optimizer, metrics=[
    "accuracy",
    "binary_accuracy",
    "categorical_accuracy",
    "sparse_categorical_accuracy",
    custom_acc
])

运行训练时，您将看到custom_acc始终等于binary_accuracy（因此等于custom_acc）。

现在您可以参考Keras code on Github来查看它是如何计算的：

K.mean(K.equal(y_true, K.round(y_pred)), axis=-1)

这证实了neurite所说的（即，如果预测值是[0, 0, 0, 0, 0, 1]，而实际标签是[0, 0, 0, 0, 0, 0]，那么准确度是5/6）。

相关问题更多 >

编程相关推荐

热门问题

热门文章