我在用Python3笔记本。我正在使用多个文本文件和多个列。如何仅使用所有3个文本文件的第一列?你知道吗
文本文件示例:
Corey 1 765
Mike 2 675
John 3 645
Tom 4 234
Ben 5 134
Corey 6 646
Mike 7 543
John 8 324
我运行的代码告诉我每个名字出现了多少次。但它也计算了数字。我怎样才能让它只计算第1列中的名字呢?你知道吗
import re
import csv
filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
article_one = re.findall('\w+', open(file,).read().lower())
for word in article_one:
word = word.lower().strip(string.punctuation)
if word not in wordbank:
wordbank[word] = 1
else:
wordbank[word] += 1
sortedwords = sorted(wordbank.items(), key=operator.itemgetter(1))
for word in sortedwords:
print (word[1], word[0])
使用ipythonpanda,我能够轻松快速地分析所有文本文件。你知道吗
Jupyter Notebook
我使用的代码:
相关问题 更多 >
编程相关推荐