我正在运行genfromtxt
,如下所示:
date_conv = lambda x: str(x).replace(":", "/")
time_conv = lambda x: str(x)
a = np.genfromtxt(input.txt, delimiter=',', skip_header=4,
usecols=[0, 1] + radii_indices, converters={0: date_conv, 1: time_conv})
其中input.txt
来自this gist。
当我查看结果时,它是一个一维数组而不是二维数组:
>>> np.shape(a)
(918,)
它似乎是一个元组数组:
>>> a[0]
('06/03/2006', '08:27:23', 6.4e-05, 0.000336, 0.001168, 0.002716, 0.004274, 0.004658, 0.003756, 0.002697, 0.002257, 0.002566, 0.003522, 0.004471, 0.00492, 0.005602, 0.006956, 0.008442, 0.008784, 0.006976, 0.003917, 0.001494, 0.000379, 6.4e-05)
如果我从genfromtxt
调用中删除转换器规范,它可以正常工作并生成二维数组:
>>> np.shape(a)
(918, 24)
返回的内容称为结构化ndarray,请参见此处:http://docs.scipy.org/doc/numpy/user/basics.rec.html。这是因为数据不是同构的,即不是所有元素都具有相同的类型:数据同时包含字符串(前两列)和浮点数。Numpy数组必须是同构的(有关解释,请参见here)。
结构化数组通过对每个记录或行使用元组来“解决”这种同质性约束,这就是返回的数组是1D的原因:一系列元组,但每个元组(行)由多个字段组成,因此可以将其视为行和列。不同的列可以作为
a['nameofcolumn']
访问,例如a['Julian_Day']
。在删除前两列的转换器时,它返回一个2D数组的原因是,在这种情况下,
genfromtxt
视为同一类型的所有数据,并返回一个正常的ndarray(默认类型是float,但可以使用dtype
参数指定)。编辑:如果要使用列名,可以使用
names
参数(并将skip_header
设置为三个参数):你可以做的例如:
相关问题 更多 >
编程相关推荐