关于在Numpy中矢量化分块操作的建议

params = [] for i in range(0,patch1.shape[0],1): for j in range(0,patch1.shape[1],1): window1 = np.copy(imga[i:i+N,j:j+N]).flatten() window2 = np.copy(imgb[i:i+N,j:j+N]).flatten() params.append((window1, window2)) print(f"We took {time()- t0:2.2f} seconds to prepare {len(params)/1e6} million patches.")

@njit def cauchy_schwartz(imga, imgb): p, _ = np.histogram(imga, bins=10) p = p/np.sum(p) q, _ = np.histogram(imgb, bins=10) q = q/np.sum(q) n_d = np.array(np.sum(p * q)) d_d = np.array(np.sum(np.power(p, 2) * np.power(q, 2))) return -1.0 * np.log10( n_d, d_d)

2条回答

网友

1楼 · 编辑于 2024-05-19 00:04:34

首先，分析代码以确定瓶颈。您可以使用https://mg.pov.lt/profilehooks/。我认为瓶颈在于补丁的创建，因为您正在为流程创建补丁的副本。通过仅传递修补程序的索引，可以使用更少的内存：

params = []
for i in range(0,patch1.shape[0],1):
    for j in range(0,patch1.shape[1],1):
        start, end = (i,i+N), (j,j+N)
        params.append((start, end))

然后，假设imga和imgb是全局的，您可以从cauchy_schwartz函数创建补丁，如下所示：

@njit
def cauchy_schwartz(start, end):

    a,b = start; c,d = end
    window1 = np.copy(imga[a:b, c:d]).flatten()
    window2 = np.copy(imgb[a:b, c:d]).flatten()

    # process patches window1 and window2

网友

2楼 · 编辑于 2024-05-19 00:04:34

通过使用apply_along_axis，您可以摆脱cauchy_schwartz。由于您不太关心预处理时间，因此假设您已获得包含展平面片的数组params

params = np.random.rand(3,2,100)

正如您可以看到的params的形状是(3,2,100)，三个数字3、2和100是随机选择的，以创建一个辅助数组来演示使用apply_along_axis的逻辑。3对应于您拥有的面片数量（由面片形状和图像大小确定），2对应于两个图像，100对应于展平面片。因此，params的轴是(idx of patches, idx of images, idx of entries of a flattened patch)，这与代码创建的列表params完全匹配

params = []
for i in range(0,patch1.shape[0],1):
    for j in range(0,patch1.shape[1],1):
        window1 = np.copy(imga[i:i+N,j:j+N]).flatten()
        window2 = np.copy(imgb[i:i+N,j:j+N]).flatten()
        params.append((window1, window2))

使用辅助数组params，以下是我的解决方案：

hist = np.apply_along_axis(lambda x: np.histogram(x,bins=11)[0],2,params)
hist = hist / np.sum(hist,axis=2)[...,None]

n_d = np.sum(np.product(hist,axis=1),axis=1)
d_d = np.sum(np.product(np.power(hist,2),axis=1),axis=1)
res = -1.0 * np.log10(n_d, d_d)

相关问题更多 >

编程相关推荐

热门问题

热门文章