我训练了一个快速的文本监督模型。我确实使用了pyfasttext python库来预测模型。 我有这样的数据。在
text - label
The meeting is planned - event
The work should be finished - task
在这里,模型正确地预测了标签。当计划或工作词出现在句子中。但我列出了与训练数据无关的句子。 狗是动物
^{pr2}$输出:
[(u'event', 0.49999999904767284)]
输出概率应为0或无标签。因为这个句子与所有标签无关。标签是多类的。我只举了两个例子。在
同样的事情也发生在scikit SGD分类器中。在
我如何防止这种错误的预测?在
您可以忽略小于阈值0.5的预测输出,例如(50%),通过这样做,您可以只提取相关预测或打印0或不为其他不相关情况的标签, 希望有帮助
相关问题 更多 >
编程相关推荐