在文本中寻找词语关系
在文本中,有时候一些词会指向同一个对象。比如说:约翰是个演员,他的父亲亚伯拉罕是医生
在这里,他的
指的是约翰
,如果我们问约翰的父亲是谁?
或者约翰的父亲的职业是什么?
,我们应该能够回答这个问题,但我不知道该怎么做。
通过词法分析和句子解析,我们可以从句子中提取出VP, NP, N
等信息。这可以帮助我们解决这个问题 - https://pypi.python.org/pypi/pylinkgrammar
潜在语义分析和概率潜在语义分析(PLSA)提供了关系,可以用来分析双模和共现数据。但具体怎么使用还不太清楚。
这更多的是一种语义和句法分析。如果有任何建议或参考资料,我会非常感激。
2 个回答
1
有一个特定的库,它依赖于NLTK,我觉得非常适合你的情况:https://code.google.com/p/nltk-drt/
这个PDF详细解释了它是怎么工作的:https://code.google.com/p/nltk-drt/downloads/detail?name=NLTK-DRT.pdf