如何在二维中扩展numpy数组?
我有一个二维数组,长得像这样:
XX
xx
请问有什么高效的方法可以添加一行和一列呢:
xxy
xxy
yyy
另外,我还想要能够删除单独的行和列。比如在下面这个矩阵中,我想把所有的a都去掉,只留下x。具体来说,我想同时删除第n行和第n列,并且希望这个过程尽可能快:
xxaxx
xxaxx
aaaaa
xxaxx
xxaxx
8 个回答
8
另一个优雅的解决方案可以用 第一个问题 的 insert
命令:
p = np.array([[1,2],[3,4]])
p = np.insert(p, 2, values=0, axis=1) # insert values before column 2
这会导致:
array([[1, 2, 0],
[3, 4, 0]])
insert
可能比 append
慢,但它可以让你轻松地用一个值填满整行或整列。
至于 第二个问题,之前有人提到过 delete
:
p = np.delete(p, 2, axis=1)
这会把原来的数组恢复过来:
array([[1, 2],
[3, 4]])
45
对于第一个问题,一个有用的替代答案是使用 tomeedee的 回答中的例子,利用numpy的 vstack 和 column_stack 方法:
给定一个矩阵 p,
>>> import numpy as np
>>> p = np.array([ [1,2] , [3,4] ])
可以通过以下方式生成一个扩展矩阵:
>>> p = np.vstack( [ p , [5 , 6] ] )
>>> p = np.column_stack( [ p , [ 7 , 8 , 9 ] ] )
>>> p
array([[1, 2, 7],
[3, 4, 8],
[5, 6, 9]])
这些方法在实际操作中可能比np.append()更方便,因为它们允许将一维数组直接添加到矩阵中,而不需要任何修改,这和下面的情况正好相反:
>>> p = np.array([ [ 1 , 2 ] , [ 3 , 4 ] , [ 5 , 6 ] ] )
>>> p = np.append( p , [ 7 , 8 , 9 ] , 1 )
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib/python2.6/dist-packages/numpy/lib/function_base.py", line 3234, in append
return concatenate((arr, values), axis=axis)
ValueError: arrays must have same number of dimensions
对于第二个问题,一个很好的方法来删除行和列是使用逻辑数组索引,具体如下:
给定一个矩阵 p,
>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )
假设我们想要删除第1行和第2列:
>>> r , c = 1 , 2
>>> p = p [ np.arange( p.shape[0] ) != r , : ]
>>> p = p [ : , np.arange( p.shape[1] ) != c ]
>>> p
array([[ 0, 1, 3, 4],
[10, 11, 13, 14],
[15, 16, 18, 19]])
注意 - 对于改用Matlab的用户 - 如果你想在一行代码中完成这些操作,你需要进行两次索引:
>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )
>>> p = p [ np.arange( p.shape[0] ) != r , : ] [ : , np.arange( p.shape[1] ) != c ]
这个技巧也可以扩展到删除一组行和列,所以如果我们想删除第0行和第2行,以及第1、2和3列,我们可以使用numpy的setdiff1d函数来生成所需的逻辑索引:
>>> p = np.arange( 20 ).reshape( ( 4 , 5 ) )
>>> r = [ 0 , 2 ]
>>> c = [ 1 , 2 , 3 ]
>>> p = p [ np.setdiff1d( np.arange( p.shape[0] ), r ) , : ]
>>> p = p [ : , np.setdiff1d( np.arange( p.shape[1] ) , c ) ]
>>> p
array([[ 5, 9],
[15, 19]])
72
我能想到的最简短的代码行数是针对第一个问题的。
>>> import numpy as np
>>> p = np.array([[1,2],[3,4]])
>>> p = np.append(p, [[5,6]], 0)
>>> p = np.append(p, [[7],[8],[9]],1)
>>> p
array([[1, 2, 7],
[3, 4, 8],
[5, 6, 9]])
然后是针对第二个问题的代码。
p = np.array(range(20))
>>> p.shape = (4,5)
>>> p
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
>>> n = 2
>>> p = np.append(p[:n],p[n+1:],0)
>>> p = np.append(p[...,:n],p[...,n+1:],1)
>>> p
array([[ 0, 1, 3, 4],
[ 5, 6, 8, 9],
[15, 16, 18, 19]])