在一个单词后面加上撇号会有什么结果?

2024-05-28 18:52:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我在python中使用nltk.stem.porter.PorterStemmer来获取词干。在

当我得到“女人”和“女人”的词干时,我得到的结果各不相同:“女人”和“女人”。为了我的目的,我需要两个词有相同的词干。在

在我的思路中,这两个词指的是同一个意思/概念,而且几乎是同一个词,经历了转变,所以它们应该有相同的词干。在

为什么我得到两个不同的结果?这是对的吗?在


Tags: 目的概念经历nltkstem词干porterporterstemmer
1条回答
网友
1楼 · 发布于 2024-05-28 18:52:26

在柠檬化之前,有必要标记文本。在

没有标记化:

>>> from nltk import word_tokenize
>>> from nltk.stem import WordNetLemmatizer
>>> wnl = WordNetLemmatizer()

>>> [wnl.lemmatize(i) for i in "the woman's going home".split()]
['the', "woman's", 'going', 'home']
>>> [wnl.lemmatize(i) for i in "the women's home is in London".split()]
['the', "women's", 'home', 'is', 'in', 'London']

使用标记化:

^{pr2}$

相关问题 更多 >

    热门问题