自然语言处理 - 类似于ngram
我现在在做一个自然语言处理(NLP)的项目,目的是在特定的上下文中区分同义词(这些同义词是通过Python的NLTK库和WordNet获取的)。我查阅了很多NLP的概念,想找到我想要的东西,最接近的就是n-grams,但这并不是完全合适。
假设我想找到动词“box”的正确含义。“box”可以指“打架”或者“包装”;但是在文本的其他地方,可能会出现“ring”或者“fighter”这个词。根据我的理解,n-gram会是“box fighter”或者“box ring”,这样的短语听起来很奇怪,而且不太可能出现。但在一个概念图上,“box”这个动作可能和“ring”有联系,因为它们在概念上是相关的。
那n-gram就是我想要的吗?有没有其他的名称可以描述这个?有没有什么建议可以帮助我找到这样的关系数据?
非常感谢大家的帮助。
1 个回答
2
你可能想了解一下 词义消歧 (WSD)
,这指的是在特定的语境中,判断一个词的哪个“意思”被激活的问题。这个过程在我们人类的思维中大多是无意识进行的。