genfromtxt和numpy
我有一些数据文件,比如“file.csv”。我想用np.genfromtxt这个工具来读取这些文件,然后对某些列(比如
这段代码几乎能得到正确的结果,但它包含了所有的
#file.csv
X,Y,Z
1,2,3
4,2,5
15,9,1
#
data = np.genfromtxt(file.csv, delimiter=',', dtype=float, unpack=True, skiprows = 0)
X=data[0];Y=data[1];Z=data[2]
Mean = np.average(X)
--> 这段代码在计算平均值方面做得很好。但是,我希望它只在
2 个回答
1
为了只对某些字段进行平均计算,你可以按照以下步骤来操作:
- 找到符合特定条件的元素的索引(也就是位置)
- 仅用这些索引来计算数组的平均值
下面的代码正是这样做的:
indexes = np.where(X>1)[0] # We index with '0' here to get to the 1st element of the returned tuple
Mean = np.mean(X[indexes])
1
你可以使用一种叫做“花哨索引”的方法,X[X>1]
,来选择你想要的数组部分:
import numpy as np
X,Y,Z = np.genfromtxt('file.csv', delimiter=',', dtype=float, unpack=True, skiprows = 0)
print(X)
# [ nan 1. 4. 15.]
print(X[X>1])
# [ 4. 15.]
print(np.average(X[X>1]))
# 9.5
要将两个掩码(布尔数组)用位与运算结合起来,可以使用 &
操作符:
print(np.average(X[(X>1)&(X<10)]))
# 4.0