多标签分类的实现

inp = Input(shape=(maxlen,)) x = Embedding(max_features, embed_size, weights=[embedding_matrix])(inp) x = Bidirectional(LSTM(50, return_sequences=True, dropout=0.1, recurrent_dropout=0.1))(x) x = GlobalMaxPool1D()(x) x = Dense(50, activation="relu")(x) x = Dropout(0.1)(x) x = Dense(6, activation="sigmoid")(x) model = Model(inputs=inp, outputs=x) model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

2条回答

网友

1楼 · 编辑于 2024-05-28 19:19:11

要使用的损失函数实际上是带有sigmoid激活的binary_crossentropy

categorical_crossentropy不适用于多标签问题，因为在多标签问题的情况下，标签不是相互排斥的。重复最后一句话：标签不是相互排斥的

这意味着[1,0,1,0,0,0]形式的标签是正确的。categorical_crossentropy和softmax总是倾向于支持一个特定的类，但事实并非如此；正如你所看到的，一条评论既有毒又淫秽

现在想象一下里面有猫和狗的照片。如果照片中有两只狗和两只猫，会发生什么？这是一张狗的画还是一张猫的画？这实际上是一张“两者皆有”的照片！我们确实需要一种方法来指定多个标签与一张照片/标签相关

使用二进制交叉熵和sigmoid进行多标签分类的基本原理在于数学特性，因为每个输出都需要被视为独立的Bernoulli distribution

因此，唯一正确的解决方案是BCE+“乙状结肠”

网友

2楼 · 编辑于 2024-05-28 19:19:11

正如您已经发现的，这不是一个“经典”的分类问题。对于您在文本中描述的分类问题，softmax激活通常用于实现高机密性和低机密性的效果，总计为1

如果你想预测一个二元问题，例如“信用卡欺诈”，你可以在softmax激活与2个输出神经元（欺诈<；->；非欺诈）和1个输出神经元的回归模型之间进行选择。在后者中，单个神经元将输出范围为[0,1]的值，并选择阈值，例如0.5。所有输出<；0.5属于0类且全部>；=0.5至1级

如果你想建立一个模型，能够预测一个输入的多个类，你应该使用回归aproach（后一个）和sigmoid激活函数。这将启用图像中的输出

老实说，对于这样的问题，我不确定“二进制交叉熵”是否是正确的损失

相关问题更多 >

编程相关推荐

热门问题

热门文章