如何在numpy结构化数组中返回多个列的视图
我可以通过用字段名称的列表来同时查看一个 numpy
结构数组中的多个列(fields
),比如:
import numpy as np
a = np.array([(1.5, 2.5, (1.0,2.0)), (3.,4.,(4.,5.)), (1.,3.,(2.,6.))],
dtype=[('x',float), ('y',float), ('value',float,(2,2))])
print a[['x','y']]
#[(1.5, 2.5) (3.0, 4.0) (1.0, 3.0)]
print a[['x','y']].dtype
#[('x', '<f4') ('y', '<f4')])
但问题是,这似乎是一个复制品,而不是一个视图:
b = a[['x','y']]
b[0] = (9.,9.)
print b
#[(9.0, 9.0) (3.0, 4.0) (1.0, 3.0)]
print a[['x','y']]
#[(1.5, 2.5) (3.0, 4.0) (1.0, 3.0)]
如果我只选择一列,那就是一个视图:
c = x['y']
c[0] = 99.
print c
#[ 99. 4. 3. ]
print a['y']
#[ 99. 4. 3. ]
有没有办法让我一次性获取多个列的视图行为呢?
我有两个解决方法,一个是逐列循环,另一个是创建一个分层的 dtype
,这样一列实际上会返回一个包含我想要的两个(或更多)字段的结构数组。不幸的是,zip
也会返回一个复制品,所以我不能这样做:
x = a['x']; y = a['y']
z = zip(x,y)
z[0] = (9.,9.)
5 个回答
7
从Numpy版本1.16开始,你提到的代码会返回一个视图。你可以在这个页面上查看相关信息:'NumPy 1.16.0发布说明->未来变化->多字段视图返回视图而不是副本'。
11
在@HYRY的回答基础上,你还可以使用ndarray
的一个方法getfield
:
def fields_view(array, fields):
return array.getfield(numpy.dtype(
{name: array.dtype.fields[name] for name in fields}
))
36
你可以创建一个dtype对象,只包含你想要的字段,然后使用numpy.ndarray()
来创建一个原始数组的视图:
import numpy as np
strc = np.zeros(3, dtype=[('x', int), ('y', float), ('z', int), ('t', "i8")])
def fields_view(arr, fields):
dtype2 = np.dtype({name:arr.dtype.fields[name] for name in fields})
return np.ndarray(arr.shape, dtype2, arr, 0, arr.strides)
v1 = fields_view(strc, ["x", "z"])
v1[0] = 10, 100
v2 = fields_view(strc, ["y", "z"])
v2[1:] = [(3.14, 7)]
v3 = fields_view(strc, ["x", "t"])
v3[1:] = [(1000, 2**16)]
print(strc)
这里是输出结果:
[(10, 0.0, 100, 0L) (1000, 3.14, 7, 65536L) (1000, 3.14, 7, 65536L)]