我对Python和熊猫还不熟悉,但我想做的是。 我想通读目录中的所有csv文件,从文件中检索一个单元格的数据,并更新字典上的计数,检索值是字典中的一个键。我必须对大约6000个csv文件执行此操作。我怎么能这么快?你知道吗
stats = {'A':0, 'B':0, 'C':0, 'D':0}
for file in f:
df = pandas.read_csv(file)
type = df["type"].head(1)[0]
stats[type]+=1
我看文件的顺序无关紧要。我希望同时做这件事,分享字典。除非有更好的方法来实现我的目标。你知道吗
您可以通过以下方式显著优化逻辑:
collections.Counter
。你知道吗下面是一些代码可以帮助您:
Counter
的妙处在于无需预先指定键。另请注意Counter
是dict
的子类,因此您不会放弃任何功能。你知道吗相关问题 更多 >
编程相关推荐