我想知道是否有可能标记一个文本,其中标记可能有几个(重叠)标签在任务中?你知道吗
我想学习汽车制造,但是,我需要把他们分为私人或商用车。你知道吗
例如:
text_0 = 'The new model of Mercedes is a great family car which also offers a space for home pets in the rear'
text_1 = 'It has been know for decades that Mercedes vehicle are very reliable for public transportation'
我需要提取汽车制造(这是很容易的,应该给'梅赛德斯'),然而,我也想知道在何种情况下,汽车制造已经提到。所以IE系统应该输出:
text_0 -> (SYSTEM) -> {'car_make': 'Mercedes', 'vehicle_type': 'private'}
text_1 -> (SYSTEM) -> {'car_make': 'Mercedes', 'vehicle_type': 'commercial'}
潜在解决方案
我可以注释一个大的语料库来训练一个统计模型。所以基本上,我可以训练两个独立的NER模型,一个用来识别代币的汽车品牌,另一个用来标记同一代币是否为私人/商业代币。你知道吗
问题是如何组合这两个模型,这样它们的输出就不会覆盖实体标记。有没有一个整洁的方法来做它在空间?你知道吗
否则,请建议如何在学习汽车品牌的任务中添加另一个属性(私人/商业)。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐