读取文本文件以按降序打印字母频率python3

def exercise11(): import string while True: try: fname = input('Enter the file name -> ') fop = open(fname) break except: print('This file does not exists. Please try again!') continue counts = {} for line in fop: line = line.translate(str.maketrans('', '', string.punctuation)) line = line.translate(str.maketrans('', '', string.whitespace)) line = line.translate(str.maketrans('', '', string.digits)) line = line.lower() for ltr in line: if ltr in counts: counts[ltr] += 1 else: counts[ltr] = 1 lst = [] countlst = [] freqlst = [] for ltrs, c in counts.items(): lst.append((c, ltrs)) countlst.append(c) totalcount = sum(countlst) for ec in countlst: efreq = (ec/totalcount) * 100 freqlst.append(efreq) freqlst.sort(reverse=True) lst.sort(reverse=True) for ltrs, c, in lst: print(c, '-', ltrs) exercise11()

3条回答

网友

1楼 · 编辑于 2024-05-14 03:31:35

元组是不可变的，这可能是您正在发现的问题。另一个简单的函数是更高级的。见下文：

元组列表格式为lst，但是由于元组是不可变的，而列表是可变的，所以选择将lst更改为列表列表是一种有效的方法。然后，由于lst是一个列表列表，每个元素都由'letter，count，frequency%'组成，所以带有lambda的排序函数可以用来根据您想要的任何索引进行排序。以下内容将插入for line in fop:循环之后。在

lst = []
for ltrs, c in counts.items():
    lst.append([ltrs,c])
totalcount = sum([x[1] for x in lst])       # sum all 'count' values in a list comprehension

for elem in lst:
    elem.append((elem[1]/totalcount)*100)   # now that each element in 'lst' is a mutable list, you can append the calculated frequency to the respective element in lst

lst.sort(reverse=True,key=lambda lst:lst[2])    # sort in-place in reverse order by index 2.

网友

2楼 · 编辑于 2024-05-14 03:31:35

freqlst、countlist和{}中的项通过它们的位置相互关联。如果有任何排序，则关系将丢失。在

在排序之前将列表压缩在一起可以保持这种关系。在

将从您的列表初始化行中提取。在

lst = []
countlst = []
freqlst = []
for ltr, c in counts.items():
    #change here, lst now only contains letters
    lst.append(ltr)
    countlst.append(c)
totalcount = sum(countlst)
for ec in countlst:
    efreq = (ec/totalcount) * 100
    freqlst.append(efreq)

#New stuff here: Note this only works in python 3+
zipped = zip(lst, countlst, freqlst)
zipped = sorted(zipped, key=lambda x: x[1])

for ltr, c, freq in zipped:
    print("{} - {} - {}%".format(ltr, c, freq)) # love me the format method :)

基本上，zip将列表组合成一个元组列表。然后可以使用lambda函数对这些元组进行排序（非常常见的堆栈问题）

网友
3楼 · 编辑于 2024-05-14 03:31:35

您的计数数据在{letter:count}对的字典中。在

您可以使用字典按如下方式计算总数：

total_count = sum(counts.values())

那么在你迭代计数之前不要计算百分比。。。在

^{pr2}$
或者，如果你想把它们都列在一个列表中，这样就可以对它们进行排序：
data = [] for letter, count in counts.items(): data.append((letter,count,100*count/total)
使用operator.itemgetter作为排序键函数可以帮助代码的可读性。在
import operator letter = operator.itemgetter(0) count = operator.itemgetter(1) frequency = operator.itemgetter(2) data.sort(key=letter) data.sort(key=count) data.sort(key=frequency)

相关问题更多 >

编程相关推荐

热门问题

热门文章