#! /usr/bin/env python
from __future__ import print_function
sep = ';'
with open('32_numeric_columns.csv', 'rt') as f:
columns = f.readline().strip().split(sep)
rows = [0] * len(columns)
for line in f.readlines():
data = line.strip().split(sep)
for i, cell in enumerate(data, start=0):
rows[i] += float(cell)
print(columns)
print(rows)
熊猫无疑是最好的选择。这两行代码将打印出列的总和。如果您在windows上,请使用“\”来指定路径。我假设您的csv文件使用分号作为分隔符(如果是逗号,则使用sep=','如果是制表符,则使用sep='\t')
如果要将结果写入文件,请使用:
^{pr2}$您可以在pandas中使用
read_csv
来读取文件,然后在dataframe上只使用sum()
。在仅在此示例数据文件上使用内置函数的简单方法:
在此数据文件中:
^{pr2}$产量:
在我的机器上处理一个包含1280000000字节数据的巨大文件需要大约5分钟才能生成:
相关问题 更多 >
编程相关推荐