Python:如何在使用多个文本文件时只使用一列?

2024-04-25 02:15:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我在用Python3笔记本。我正在使用多个文本文件和多个列。如何仅使用所有3个文本文件的第一列?你知道吗

文本文件示例:

Corey       1     765
Mike        2     675
John        3     645
Tom         4     234
Ben         5     134
Corey       6     646
Mike        7     543
John        8     324

我运行的代码告诉我每个名字出现了多少次。但它也计算了数字。我怎样才能让它只计算第1列中的名字呢?你知道吗

import re import csv filelist = ['D.txt','A.txt','S.txt'] wordbank = {} for file in filelist: article_one = re.findall('\w+', open(file,).read().lower()) for word in article_one: word = word.lower().strip(string.punctuation) if word not in wordbank: wordbank[word] = 1 else: wordbank[word] += 1 sortedwords = sorted(wordbank.items(), key=operator.itemgetter(1)) for word in sortedwords: print (word[1], word[0])
上面是我的代码

Tags: 代码inimportretxtfor名字john
2条回答
import pandas as pd

data = pd.Series()
for file in filelist:
   data2  = pd.read_csv(file, sep=" ", header = None, usecols =[0])
   data   = pd.concat((data,data2[0].str.lower(), axis=0) 

yourData  = dict(pd.Series(data).value_counts())

使用ipythonpanda,我能够轻松快速地分析所有文本文件。你知道吗

Jupyter Notebook

我使用的代码:

import pandas as pd
dft = pd.read_csv('sample.txt')
dft['Column'].value_counts()

相关问题 更多 >