对于Python-NLTK,是否有一个词干分析器来区分未知单词?

2024-06-08 12:31:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在对文档进行词干分析,需要将有词干的单词和没有词干的单词分开。NLTK词干分析方法都返回没有词干的单词的输入。你知道吗

stemmer.stem('running')      # word has a stem
run
stemmer.stem('run')            # word stem is the word itself
run
stemmer.stem('asdf')          # word is nonsense
asdf

我需要一种方法来区分后一种情况。是否有返回两个结果(stem和found指示符)的词干分析器或有效的词干列表?你知道吗


Tags: therun文档is单词runningword分析方法