Nltk中的WordNetLemmatizer能否对单词进行词干提取?
我想用 Wordnet
找到单词的词根。请问 Wordnet
有没有处理词根的功能?我用这个导入来处理词根,但效果并不如我所想。
from nltk.stem.wordnet import WordNetLemmatizer
WordNetLemmatizer().lemmatize('Having','v')
3 个回答
0
不,Wordnet 不能对单词进行词干提取。它只能提供词形还原后的单词,也就是在语言中实际存在的单词。而词干提取器有时候可能会给出一些没有实际意义的单词。
10
看起来你需要输入一个小写字母的字符串给lemmatize
这个方法:
>>> WordNetLemmatizer().lemmatize('having','v')
'have'
>>> WordNetLemmatizer().lemmatize('has','v')
'have'
2
试试使用 nltk.stem 模块里的某个词干提取器,比如 PorterStemmer。这里有一个NLTK词干提取器的在线演示:http://text-processing.com/demo/stem/