让Spacy NER只搜索公司名称，而不将计算能力浪费在其他任何东西上（使用现有的语言模型）？

import spacy nlp = spacy.load("sv_pipeline-0.0.0/sv_pipeline/sv_pipeline-0.0.0") doc = nlp("Jag jobbade på Random Företag AB. Sedan fick jag jobbet på DenAndraFöretaget AB") width = 15 for ent in doc.ents: print(ent.text, ent.label_)

1条回答

网友

1楼 · 发布于 2024-04-26 14:41:52

不能将模型更改为仅标记一个命名实体

你可以忽略你不在乎的实体

for ent in doc.ents:
    if ent.label_ != "ORG": continue
    ... do stuff ...

你不能删掉其他实体，因为它们不像单独的功能，模型使用它对所有不同类型的知识来帮助它找出模棱两可的情况，比如知道“约翰·史密斯”是一个人，而“约翰·迪尔”可能是一家公司

好消息是，它不是“处理无用信息”或“浪费计算能力”。如果你训练一个模型只识别组织实体，它不会更快

编程相关推荐

为什么sonar认为这个表达式总是错误的
java为什么PrintWriter不能工作？
java将数组从php发送到安卓 studio
java在静态方法中调用非静态方法
java何时使用Swingutiles。invokeAndWait/invokeLater
java jdbc:embeddeddatabase引发HsqlException
java度量Hyperledger结构项目的性能
java将字符串转换为Blob
java如何将文本添加到文本区域而不是替换它
java如何对100GB的字符串进行排序

相关问题更多 >

编程相关推荐

热门问题

热门文章

让Spacy NER只搜索公司名称，而不将计算能力浪费在其他任何东西上（使用现有的语言模型）？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >