如何使用for循环和Python中的csv库遍历列？

import csv data = file("test.csv", "r") headerrow = data.next() headerrow = headerrow.strip().split(",") end = len(headerrow) for i in range (1, end): for row in csv.reader(data): print row[i]

import csv with open("test.csv") as data: headerrow = next(data) delim = "," if "," == headerrow[0] else " " headerrow = filter(None, headerrow.rstrip().split(delim)) reader = csv.reader(data, delimiter=delim, skipinitialspace=True) zipped = zip(*reader) print zipped strings = next(zipped) print ([sum(map(int,col)) for col in zipped])

3条回答

网友

1楼 · 编辑于 2024-04-26 23:08:43

import csv
with  open('in.csv')as f:
    head = next(f)
    # decide delimiter by what is in header 
    delim = "," if "," ==  head[0] else " "
    # need to filter empty strings 
    head = filter(None, head.rstrip().split(delim))
    # skipinitialspace must be set as you have two spaces delimited
    reader = csv.reader(f,delimiter=delim, skipinitialspace=True)
    # transpose rows
    zipped = zip(*reader)
    # skip first column
    strings = next(zipped)
    # sum each column
    print([sum(map(int,col)) for col in zipped])

[0, 16, 22, 22, 0, 20]

要创建将标题与colunm sums相匹配的dict，您可以这样做：

print(dict(zip(list(head), (sum(map(int,col)) for col in zipped))))

哪些输出：

{'u': 20, 'w': 22, 'x': 22, 'z': 0, 'y': 16, 'v': 0}

我使用python3来完成以上所有操作，如果您使用python2，请替换为：

zip -> itertools.izip
filter -> itertools.izip
map -> itertools.imap

Python2代码：

import csv
from itertools import izip, imap, ifilter
with  open('in.csv')as f:
    head = next(f)
    # decide delimiter by what is in header
    delim = "," if "," ==  head[0] else " "
    # need to filter empty strings
    head = ifilter(None, head.rstrip().split(delim))
    # skipinitialspace must be set as you have two spaces delimited
    reader = csv.reader(f,delimiter=delim, skipinitialspace=True)
    # transpose rows
    zipped = izip(*reader)
    # skip first column
    strings = next(zipped)
    # sum each column
    print([sum(imap(int,col)) for col in zipped])

输出：

[0, 16, 22, 22, 0, 20]

如果你正在做很多这样的工作，那么熊猫尤其是pandas.read_csv可能是有用的，下面是一个非常基本的例子，一些熊猫大师可能会希望添加到其中：

import  pandas as pd

df = pd.read_csv("in.csv")
print(df.sum())
Unnamed: 0    abcd
z                0
y               16
x               22
w               22
v                0
u               20
dtype: object

网友

2楼 · 编辑于 2024-04-26 23:08:43

您可以使用numpy：

import csv
import numpy as np
with open("test.csv") as f:
    r = csv.reader(f, delimiter=",")
    # For space format: r = csv.reader(f, delimiter=" ", skipinitialspace=True)
    # Thanks to Padraic Cunningham ^^
    next(r) # Skip header row
    sums = sum((np.array(map(int, row[1:])) for row in r))

结果：

>>> sums
array([ 0, 16, 22, 22,  0, 20])

网友

3楼 · 编辑于 2024-04-26 23:08:43

这可能会澄清一些到底发生了什么。。。看起来你把事情搞得有点复杂了。这是一个非常简单的Python，并不打算直接或最终解决您的问题，但更多的是帮助理解正在发生的事情。

import csv 

sumthree = 0

with open('test.csv', 'rb') as f:    # Open the file (always use binary 'rb' mode for CSV files)
    header = next(f)        # Extract the header line from the file
    csvr = csv.reader(f)    # Create a CSV object with the rest of the file
    for row in csvr:
        print row           # Now loop over the file and print each row

        sumthree += int(row[2])

    print sumthree

此时，每个row将作为列表打印，例如['a','0','8','7','6','0','5']

所以每次循环中的迭代，我们都是逐行向下移动。row[0]将是第一列，row[1]将是第二列，以此类推。如果要对文件的第三列求和，可以使用sumthree += int(row[2])。最后，我们print sumthree看到第三列中所有数字的总和。

相关问题更多 >

编程相关推荐

热门问题

热门文章