我想计算文本文件中特定关键字(存储在.txt文件中,每行一个单词)的出现次数,并打印出现次数最多的50个。以下是我所做的:
from collections import Counter
with open("./Text_file.txt", "r", encoding='utf8') as logfile:
word_counts = Counter(logfile.read().split())
with open("./key_words.txt", "r", encoding='utf8') as word:
lines = word.readlines()
for line in lines:
count = [word_counts.get('line')]
lst = sorted (count)
print (lst[:50])
我把这个还给我,这并不意味着什么:
[20]
有什么帮助吗
一种选择
使用计数器+正则表达式的替代方法
正则表达式用于将单词与标点符号分开,如句号、引号、逗号等
在这里
word_counts.get('line')
,您只需要在每次迭代中调用line
,这就是为什么结果列表只有一个值。以下是您对关键词前50个单词的修改代码以下是您可以做的:
相关问题 更多 >
编程相关推荐