查找lis中最不常见的元素

2024-05-16 09:30:48 发布

男 | 程序猿一只，喜欢编程写python代码。

我想在一个大的文本体中生成一个最不常用词的有序列表，其中最不常用的词首先出现，并有一个值指示它在文本中出现的次数。

我从一些在线期刊文章中抓取文本，然后简单地分配和拆分

article_one = """ large body of text """.split() 
=> ("large","body", "of", "text")

似乎regex适合接下来的步骤，但作为编程新手，我并不精通- 如果最好的答案包括一个regex，有人能给我指一个除了pydoc之外的好的regex教程吗？

Tags： of text 文本 article 文章步骤 body 次数

0条回答

目前没有回答