使用WordNet词形还原器的问题
我试过使用WordNet词形还原器,但发现一些常见的词,比如“studying”(学习)或“waiting”(等待),处理得不太对。
我是不是漏掉了什么?
2 个回答
2
默认情况下,NLTK中的WordNetLemmatizer
会把单词当作NOUN
(名词)来处理。你可以查看这个链接了解更多信息:http://nltk.org/_modules/nltk/stem/wordnet.html
如果你想正确处理动词的词形还原,就需要指定pos
(词性)。
>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> wnl = WordNetLemmatizer()
>>> wnl.lemmatize('studying','v')
'study'
>>> wnl.lemmatize('studying','n')
'studying'
>>> wnl.lemmatize('studying')
'studying'
>>> wnl.lemmatize('waiting','n')
'waiting'
>>> wnl.lemmatize('waiting','v')
'wait'