Spacy NER将实体拆分为两个单独的实体

2024-03-29 07:50:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做下面的课文

print([(i.text, i.label_) for i in doc.ents])

我的文字看起来像

^{pr2}$

我得到了输出

('ZS L-1', 'ORG'), ('Cocoa & Burgers Ltd', 'ORG'), ('2017', 'DATE')

如何正确获取组织名称

('ZS L-1 Cocoa & Burgers Ltd', 'ORG')

此外,该公司未能将2013年视为日期实体。我的spacy版本是2.0,我使用的是这个模型-en_core_web_md-2.0.0。这通常发生在我对整篇课文做NER时。当我只知道公司名称的时候,效果很好。在


Tags: textinorg名称fordoc公司label
1条回答
网友
1楼 · 发布于 2024-03-29 07:50:29

我没有足够的声誉发表评论,所以在这里添加答案:

有两种解决方案:

要么根据自己的数据训练模型:

Training spaCy’s Statistical Models

如果您想下载中型,请使用以下选项:

Available models : sm,md,lg

您还可以比较小型、大型模型here的输出:

相关问题 更多 >