使用简单代码获取csv fi中整列的平均值（用Python）

import csv import numpy as np with open('2010-Jan-June.csv', 'r', encoding='utf8', newline='') as f: highs = [] for row in csv.DictReader(f, delimiter=','): high = int(row['high']) print(sum(highs)/len(highs))

3条回答

网友

1楼 · 编辑于 2024-05-23 17:39:44

既然您导入了numpy，您就可以像pandas一样轻松地使用它：

从样本的粘贴副本中读取：

In [36]: txt="""date,high,low,precip
    ...: 1-Jan,43,41,0
    ...: 2-Jan,50,25,0
    ...: 3-Jan,51,25,0
    ...: 4-Jan,44,25,0
    ...: 5-Jan,36,21,0
    ...: 6-Jan,39,20,0
    ...: 7-Jan,47,21,0.04
    ...: 8-Jan,30,14,0
    ...: 9-Jan,30,12,0"""

numpy 1.14的Python3喜欢使用encoding参数：

In [38]: data = np.genfromtxt(txt.splitlines(),delimiter=',',dtype=None,names=True,
    ...: encoding=None)
In [39]: data
Out[39]: 
array([('1-Jan', 43, 41, 0.  ), ('2-Jan', 50, 25, 0.  ),
       ('3-Jan', 51, 25, 0.  ), ('4-Jan', 44, 25, 0.  ),
       ('5-Jan', 36, 21, 0.  ), ('6-Jan', 39, 20, 0.  ),
       ('7-Jan', 47, 21, 0.04), ('8-Jan', 30, 14, 0.  ),
       ('9-Jan', 30, 12, 0.  )],
      dtype=[('date', '<U5'), ('high', '<i8'), ('low', '<i8'), ('precip', '<f8')])

结果是一个结构化数组，从中很容易选择high字段：

In [40]: data['high']
Out[40]: array([43, 50, 51, 44, 36, 39, 47, 30, 30])
In [41]: data['high'].mean()
Out[41]: 41.111111111111114

或者在一行中，只加载一列：

In [44]: np.genfromtxt(txt.splitlines(),delimiter=',',skip_header=1,usecols=[1]).mean()
Out[44]: 41.111111111111114

网友

2楼 · 编辑于 2024-05-23 17:39:44

使用熊猫：

import pandas as pd

avg = pd.read_csv(r'/path/to/2010-Jan-June.csv', usecols=['high'], squeeze=True).mean()

网友

3楼 · 编辑于 2024-05-23 17:39:44

注意，使用纯Python完全可以做到这一点：

import csv
import statistics as stats

with open('2010-Jan-June.csv') as f:
    avg = stats.mean(row['high'] for row in csv.DictReader(f, delimiter=','))

print(avg)

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用简单代码获取csv fi中整列的平均值（用Python）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >