"NumPy方法将两个网格和其结果数组连接在一起"

import numpy as np a1 = [1, 5, 7] b1 = [2, 5, 6] x1,y1 = np.meshgrid(a1,b1) r1 = x1*y1 a2 = [2, 4, 6] b2 = [1, 3, 8] x2, y2 = np.meshgrid(a2,b2) r2 = 2*x2 a = [1, 2, 4, 5, 6, 7] b = [1, 2, 3, 5, 6, 8] x,y = np.meshgrid(a,b) r = np.ones(x.shape)*-1 for i in range(x.shape[0]): for j in range(x.shape[1]): if x[i,j] in a1 and y[i,j] in b1: r[i,j] = r1[a1.index(x[i,j]),b1.index(y[i,j])] elif x[i,j] in a2 and y[i,j] in b2: r[i,j] = r2[a2.index(x[i,j]),b2.index(y[i,j])]

x= [[1 2 4 5 6 7] [1 2 4 5 6 7] [1 2 4 5 6 7] [1 2 4 5 6 7] [1 2 4 5 6 7] [1 2 4 5 6 7]] y= [[1 1 1 1 1 1] [2 2 2 2 2 2] [3 3 3 3 3 3] [5 5 5 5 5 5] [6 6 6 6 6 6] [8 8 8 8 8 8]] r= [[ -1. 4. 4. -1. 4. -1.] [ 2. -1. -1. 5. -1. 6.] [ -1. 8. 8. -1. 8. -1.] [ 10. -1. -1. 25. -1. 30.] [ 14. -1. -1. 35. -1. 42.] [ -1. 12. 12. -1. 12. -1.]]

2条回答

网友

1楼 · 编辑于 2024-06-02 06:01:02

Divakar的回答正是我所需要的。不过，我还是想试试这个答案中的第二个建议，然后我做了一些分析。我想其他人可能会对结果感兴趣。以下是我用于分析的代码：

import numpy as np
import timeit
import random

def for_join_2d(x1,y1,r1, x2,y2,r2):
    """
    The algorithm from the question.
    """

    a = sorted(list(x1[0,:])+list(x2[0,:]))
    b = sorted(list(y1[:,0])+list(y2[:,0]))

    x,y = np.meshgrid(a,b)
    r = np.ones(x.shape)*-1

    for i in range(x.shape[0]):
        for j in range(x.shape[1]):
            if   x[i,j] in a1 and y[i,j] in b1:
                r[i,j] = r1[a1.index(x[i,j]),b1.index(y[i,j])]

            elif x[i,j] in a2 and y[i,j] in b2:
                r[i,j] = r2[a2.index(x[i,j]),b2.index(y[i,j])]
    return x,y,r


def mask_join_2d(x1,y1,r1,x2,y2,r2):
    """
    Divakar's original answer.
    """
    a = np.sort(np.concatenate((x1[0,:],x2[0,:])))
    b = np.sort(np.concatenate((y1[:,0],y2[:,0])))

    # Initialize o/p array
    x,y = np.meshgrid(a,b)
    r_out = np.full([len(a), len(b)],-1)           

    # Assign for the IF part
    mask_a1 = np.in1d(a,a1)
    mask_b1 = np.in1d(b,b1)
    r_out[np.ix_(mask_b1, mask_a1)] = r1.T

    # Assign for the ELIF part
    mask_a2 = np.in1d(a,a2)
    mask_b2 = np.in1d(b,b2)
    r_out[np.ix_(mask_b2, mask_a2)] = r2.T

    return x,y,r_out


def searchsort_join_2d(x1,y1,r1,x2,y2,r2):
    """
    Divakar's second suggested solution using searchsort.
    """

    a = np.sort(np.concatenate((x1[0,:],x2[0,:])))
    b = np.sort(np.concatenate((y1[:,0],y2[:,0])))

    # Initialize o/p array
    x,y = np.meshgrid(a,b)
    r_out = np.full([len(a), len(b)],-1)           

    #the IF part
    ind_a1 = np.searchsorted(a,a1)
    ind_b1 = np.searchsorted(b,b1)
    r_out[np.ix_(ind_b1,ind_a1)] = r1.T

    #the ELIF part
    ind_a2 = np.searchsorted(a,a2)
    ind_b2 = np.searchsorted(b,b2)
    r_out[np.ix_(ind_b2,ind_a2)] = r2.T

    return x,y,r_out

##the profiling code:
if __name__ == '__main__':

    N1 = 100
    N2 = 100

    coords_a = [i for i in range(N1)]
    coords_b = [i*2 for i in range(N2)]

    a1 = random.sample(coords_a, N1//2)
    b1 = random.sample(coords_b, N2//2)

    a2 = [i for i in coords_a if i not in a1]
    b2 = [i for i in coords_b if i not in b1]

    x1,y1 = np.meshgrid(a1,b1)
    r1 = x1*y1
    x2,y2 = np.meshgrid(a2,b2)
    r2 = 2*x2

    print("original for loop")
    print(min(timeit.Timer(
        'for_join_2d(x1,y1,r1,x2,y2,r2)',
        setup = 'from __main__ import for_join_2d,x1,y1,r1,x2,y2,r2',
    ).repeat(7,1000)))

    print("with masks")
    print(min(timeit.Timer(
        'mask_join_2d(x1,y1,r1,x2,y2,r2)',
        setup = 'from __main__ import mask_join_2d,x1,y1,r1,x2,y2,r2',
    ).repeat(7,1000)))

    print("with searchsort")
    print(min(timeit.Timer(
        'searchsort_join_2d(x1,y1,r1,x2,y2,r2)',
        setup = 'from __main__ import searchsort_join_2d,x1,y1,r1,x2,y2,r2',
    ).repeat(7,1000)))

对于每个函数，我使用7组1000次迭代，并选择最快的一组进行评估。两个10x10阵列的结果是：

^{pr2}$

对于两个100x100阵列：

original for loop
247.88183582702186

with masks
0.5245905339252204

with searchsort
0.2439237720100209

对于大矩阵，使用numpy功能会产生巨大的不同，实际上searchsort和索引，而不是掩盖大约一半的运行时间。在

网友

2楼 · 编辑于 2024-06-02 06:01:02

我们可以使用一些掩蔽来替换A in B部分，从而得到1D掩码。然后，我们可以使用带有^{}的掩码来扩展到所需的维数。在

因此，对于一个2D的情况，应该是这样的-

# Initialize o/p array
r_out = np.full([len(a), len(b)],-1)           

# Assign for the IF part
mask_a1 = np.in1d(a,a1)
mask_b1 = np.in1d(b,b1)
r_out[np.ix_(mask_b1, mask_a1)] = r1.T

# Assign for the ELIF part
mask_a2 = np.in1d(a,a2)
mask_b2 = np.in1d(b,b2)
r_out[np.ix_(mask_b2, mask_a2)] = r2.T

可以创建a，如下-

^{pr2}$

类似地，对于b。在

此外，我们可以使用索引而不是掩码来与np.ix_一起使用。同样，我们可以使用np.searchsorted。因此，代替掩码np.in1d(a,a1)，我们可以用np.searchsorted(a,a1)等方法得到其余掩码的相应索引。这应该快得多。在

对于3D的情况，我假设我们将有另一个数组，比如c。因此，初始化部分将涉及使用len(c)。将有一个对应于c的掩码/索引数组，因此又有一个项进入^{}，并且会有{}和{}的转置。在

相关问题更多 >

编程相关推荐

热门问题

热门文章