快速文本忽略错误的预测?

2020-12-04 16:15:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我训练了一个快速的文本监督模型。我确实使用了pyfasttext python库来预测模型。 我有这样的数据。在

text - label

The meeting is planned - event
The work should be finished - task

在这里,模型正确地预测了标签。当计划或工作词出现在句子中。但我列出了与训练数据无关的句子。 狗是动物

^{pr2}$

输出:

[(u'event', 0.49999999904767284)]

输出概率应为0或无标签。因为这个句子与所有标签无关。标签是多类的。我只举了两个例子。在

同样的事情也发生在scikit SGD分类器中。在

我如何防止这种错误的预测?在