发行股份有限公司

2024-05-23 03:20:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我面临的问题与 Stanford CoreNLP OpenIE annotator 我尝试输出=nlp.注释(s,properties={“annotators”:“tokenize,ssplit,pos,depparse,natlog,openie”,“outputFormat”:“json”,“openie.triple.strict公司“:”真“,”openie.max_includements_per_子句“:”1“,”openie.splitter.disable“:”真“})

但我还是有4个条款

(u'是从',u'是百分之二十的电动机',u'是装配线')(u'是从',u'是电动机',u'是装配线')(u'是',u'是百分之二十的电动机',u是'拉动') 我做错什么了吗?如何得到精确的三倍 (“来自”、“20%电机”、“装配线”)


Tags: posnlppropertiescorenlpannotatortokenizestanford电动机
1条回答
网友
1楼 · 发布于 2024-05-23 03:20:54

这实际上是预期的行为。在OpenIE系统中,一个设计决策就是生成所有的三元组,这些三元组在逻辑上是由原始句子所包含的,即使它们是多余的。这个想法是,这些三元组通常用于类似于IR-ish查找的东西,在这些情况下,不必对任何三元组是否与查询“足够相似”进行模糊匹配是很方便的。在

相关问题 更多 >

    热门问题