Python中带空间的序列多重标记

2024-05-23 20:36:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道是否有可能标记一个文本,其中标记可能有几个(重叠)标签在任务中?你知道吗

我想学习汽车制造,但是,我需要把他们分为私人或商用车。你知道吗

例如:

text_0 = 'The new model of Mercedes is a great family car which also offers a space for home pets in the rear'

text_1 = 'It has been know for decades that Mercedes vehicle are very reliable for public transportation'

我需要提取汽车制造(这是很容易的,应该给'梅赛德斯'),然而,我也想知道在何种情况下,汽车制造已经提到。所以IE系统应该输出:

text_0 -> (SYSTEM) -> {'car_make': 'Mercedes', 'vehicle_type': 'private'}

text_1 -> (SYSTEM) -> {'car_make': 'Mercedes', 'vehicle_type': 'commercial'}

潜在解决方案

我可以注释一个大的语料库来训练一个统计模型。所以基本上,我可以训练两个独立的NER模型,一个用来识别代币的汽车品牌,另一个用来标记同一代币是否为私人/商业代币。你知道吗

问题是如何组合这两个模型,这样它们的输出就不会覆盖实体标记。有没有一个整洁的方法来做它在空间?你知道吗

否则,请建议如何在学习汽车品牌的任务中添加另一个属性(私人/商业)。你知道吗


Tags: text标记模型formaketype私人car