如何制作一个演示Zipf定律的Python程序？

import operator, pprint punctuater = ['`','~','!','@','#','$','%','*','(',')','-', \ '_','+','=','[','\]','{','}','|','\\','\"','\'', \ ':',';','<',',','>','.','/','?','^','&'] numbers = [1,2,3,4,5,6,7,8,9,0] def convertForZipf(string): string = (string.lower()) for i in punctuater: if i in string: string = string.replace(i, '') return string.split() text = 'Lorem Ipsum Ipsum Ipsum Meow h h h h h n n n n n dolor dolor' words = convertForZipf(text) wordsRanked = {} for i in words: wordsRanked.setdefault(i, 0) wordsRanked[i] += 1 wordsRanked = (str((sorted(wordsRanked.items(), key=operator.itemgetter(1), reverse=True)))) for i in wordsRanked: try: int(i) wordsRanked = wordsRanked.replace(str(i), str(i)+'\n') except ValueError: pass print((wordsRanked.replace('[','') .replace('(','') .replace(')','') .replace(']','') .replace(',',' : ')))

1条回答

网友

1楼 · 发布于 2024-04-24 04:17:04

这应该符合您的标准-我不知道您在代码末尾对for循环做了什么-您是否尝试替换数字？如果是这样的话，您可以修改我使用的regex模式。你知道吗

import re
from collections import OrderedDict

pattern = re.compile('[\W_]+')

def convertForZipf(string):
    string = string.lower()
    pattern.sub('', string)
    return string.split()

text = 'Lorem Ipsum Ipsum Ipsum Meow h h h h h n n n n n dolor dolor'
words = convertForZipf(text)
wordsRanked = {}

for i in words:
    if i not in wordsRanked:
        wordsRanked[i] = 1
    else:
        wordsRanked[i] += 1

wordsRanked = OrderedDict(sorted(wordsRanked.items(), key=lambda t: t[1], reverse=True))

for k, v in wordsRanked.items():
    print(f"{k} appears {v} times.")

输出：

h appears 5 times.
n appears 5 times.
ipsum appears 3 times.
dolor appears 2 times.
lorem appears 1 times.
meow appears 1 times.

相关问题更多 >

编程相关推荐

热门问题

热门文章