numpy.genfromtxt产生看起来像元组而不是2D数组的数组-为什么？

date_conv = lambda x: str(x).replace(":", "/") time_conv = lambda x: str(x) a = np.genfromtxt(input.txt, delimiter=',', skip_header=4, usecols=[0, 1] + radii_indices, converters={0: date_conv, 1: time_conv})

>>> a[0] ('06/03/2006', '08:27:23', 6.4e-05, 0.000336, 0.001168, 0.002716, 0.004274, 0.004658, 0.003756, 0.002697, 0.002257, 0.002566, 0.003522, 0.004471, 0.00492, 0.005602, 0.006956, 0.008442, 0.008784, 0.006976, 0.003917, 0.001494, 0.000379, 6.4e-05)

1条回答

网友

1楼 · 发布于 2024-05-16 09:28:35

返回的内容称为结构化ndarray，请参见此处：http://docs.scipy.org/doc/numpy/user/basics.rec.html。这是因为数据不是同构的，即不是所有元素都具有相同的类型：数据同时包含字符串（前两列）和浮点数。Numpy数组必须是同构的（有关解释，请参见here）。

结构化数组通过对每个记录或行使用元组来“解决”这种同质性约束，这就是返回的数组是1D的原因：一系列元组，但每个元组（行）由多个字段组成，因此可以将其视为行和列。不同的列可以作为a['nameofcolumn']访问，例如a['Julian_Day']。

在删除前两列的转换器时，它返回一个2D数组的原因是，在这种情况下，genfromtxt视为同一类型的所有数据，并返回一个正常的ndarray（默认类型是float，但可以使用dtype参数指定）。

编辑：如果要使用列名，可以使用names参数（并将skip_header设置为三个参数）：

a2 = np.genfromtxt("input.txt", delimiter=',', skip_header=3, names = True, dtype = None,
                  usecols=[0, 1] + radii_indices, converters={0: date_conv, 1: time_conv})

你可以做的例如：

>>> a2['Dateddmmyyyy']
array(['06/03/2006', '06/03/2006', '18/03/2006', '19/03/2006',
       '19/03/2006', '19/03/2006', '19/03/2006', '19/03/2006',
       '19/03/2006', '19/03/2006'], 
      dtype='|S10')

相关问题更多 >

编程相关推荐

热门问题

热门文章