如何在空间模型中添加专有名词作为词汇?

2024-04-26 18:54:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用Python.0和Spacy进行医学文档分析。有一种方法可以将新的实体类型添加到spacy的命名实体识别器中。然而,有没有可能将药品名称作为专有名词添加到spcay的词汇表中?还是需要通过培训spacy NER来添加它们? 谢谢


Tags: 词汇表方法文档实体名称类型spacy命名
1条回答
网友
1楼 · 发布于 2024-04-26 18:54:22

我不知道你到底想做什么。。。但下面是一些可能性的解决方案。在

  1. 您有感兴趣的药品的完整列表…

    i.并且您需要一个特殊的规则来对这些字符串进行标记化:不推荐这种方法,但原则上您可以向标记器添加特殊情况。在

    二。而且您只需要找到它们:然后您应该在创建文档之后使用匹配器来高效地查找它们。然后你可以做你想做的跨度,你找到。如果你想的话,把它们变成代词。

  2. 您没有感兴趣的药品的完整列表…

    i.但您通常需要识别它们:然后需要训练一个NER模型来识别它们。为了生成训练数据,你可以拿一大堆论文,用一个匹配器寻找已知的药物/药物来获取一大堆例句。然后你训练。。。

稍后编辑:为了清楚起见,voab只存储字符串,并为它们分配一个唯一的ID,以便在引擎盖下工作。是标签决定了它是不是一个尖头。在

相关问题 更多 >