查找lis中最不常见的元素

2024-05-16 09:30:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我想在一个大的文本体中生成一个最不常用词的有序列表,其中最不常用的词首先出现,并有一个值指示它在文本中出现的次数。

我从一些在线期刊文章中抓取文本,然后简单地分配和拆分

article_one = """ large body of text """.split() 
=> ("large","body", "of", "text")

似乎regex适合接下来的步骤,但作为编程新手,我并不精通- 如果最好的答案包括一个regex,有人能给我指一个除了pydoc之外的好的regex教程吗?


Tags: oftext文本article文章步骤body次数