我面临的问题与 Stanford CoreNLP OpenIE annotator 我尝试输出=nlp.注释(s,properties={“annotators”:“tokenize,ssplit,pos,depparse,natlog,openie”,“outputFormat”:“json”,“openie.triple.strict公司“:”真“,”openie.max_includements_per_子句“:”1“,”openie.splitter.disable“:”真“})
但我还是有4个条款
(u'是从',u'是百分之二十的电动机',u'是装配线')(u'是从',u'是电动机',u'是装配线')(u'是',u'是百分之二十的电动机',u是'拉动') 我做错什么了吗?如何得到精确的三倍 (“来自”、“20%电机”、“装配线”)
这实际上是预期的行为。在OpenIE系统中,一个设计决策就是生成所有的三元组,这些三元组在逻辑上是由原始句子所包含的,即使它们是多余的。这个想法是,这些三元组通常用于类似于IR-ish查找的东西,在这些情况下,不必对任何三元组是否与查询“足够相似”进行模糊匹配是很方便的。在
相关问题 更多 >
编程相关推荐