我正在对文档进行词干分析,需要将有词干的单词和没有词干的单词分开。NLTK词干分析方法都返回没有词干的单词的输入。你知道吗
stemmer.stem('running') # word has a stem
run
stemmer.stem('run') # word stem is the word itself
run
stemmer.stem('asdf') # word is nonsense
asdf
我需要一种方法来区分后一种情况。是否有返回两个结果(stem和found指示符)的词干分析器或有效的词干列表?你知道吗
Tags:
目前没有回答
相关问题 更多 >
编程相关推荐