如何删除名词列表中的复数?

2024-05-29 07:32:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个字符串列表:

['bill', 'simpsons', 'cosbys', 'cosby','bills','mango', 'mangoes']

从这个列表中删除所有复数的最佳方法是什么? 所以,我希望输出是:

^{pr2}$

Tags: 方法字符串列表复数billbillsmangopr2
3条回答

一般来说,这个过程称为“词干分析”,python有一个名为“词干分析”的包。在

这样使用:

from stemming.porter2 import stem
stem("simpsons")

词干分析不仅仅是词干复数,但是您可以修改词干分析软件包以只执行复数词干分析。查看源代码:http://tartarus.org/martin/PorterStemmer/python.txt

对于NodeBox Linguistics,它只需要两行:

import en
only_singulars = [w for w in noun_list if w == en.noun.singular(w)]

该库实现了考虑各种异常情况的Conway's pluralization rules。在

Pluralization rules有许多角盒。也许您可以绕过基于规则的方法,使用字典查找来识别单词的复数形式和单数形式。在

相关问题 更多 >

    热门问题