如何在Python中使用VIPS执行逻辑操作和逻辑索引？

# from gi.repository import Vips def get_log_kernel(siz, std): x = y = np.linspace(-siz, siz, 2*siz+1) x, y = np.meshgrid(x, y) arg = -(x**2 + y**2) / (2*std**2) h = np.exp(arg) h[h < sys.float_info.epsilon * h.max()] = 0 h = h/h.sum() if h.sum() != 0 else h h1 = h*(x**2 + y**2 - 2*std**2) / (std**4) return h1 - h1.mean() def get_fmap(img): # img is a 3-d numpy array. log_response = np.zeros_like(img[:, :, 0], dtype='single') fmap = np.zeros_like(img[:, :, 0], dtype='uint8') log_kernel = get_log_kernel(11, 2) # kernel = get_log_kernel(11, 2) # kernel = [list(row) for row in kernel] # kernel = Vips.Image.new_from_array(kernel) # img = Vips.new_from_file("testimg.tif") for ii in range(img.shape[2]): # img_filtered = img.conv(kernel) img_filtered = cv2.filter2D(img[:, :, ii].astype('single'), -1, log_kernel) index = img_filtered > log_response log_response[index] = img_filtered[index] fmap[index] = ii return fmap

2条回答

网友

1楼 · 编辑于 2024-05-13 22:10:00

在参考了Python VIPS manual和一些尝试和错误之后，我想出了我自己的答案。我正在讨论的numpy和OpenCV实现可以转化为vip，如下所示：

import pyvips

img = []
for ii in range(num_z_levels):
    img.append(pyvips.Image.new_from_file("testimg_z" + str(ii) + ".tif")

def get_fmap(img)
    log_kernel = get_log_kernel(11,2)  # get_log_kernel is my own function, which generates a 2-d numpy array.
    log_kernel = [list(row) for row in log_kernel]  # pyvips.Image.new_from_array takes 1-d list array.
    log_kernel = pyvips.Image.new_from_array(log_kernel)  # Turn the kernel into Vips array so it can be used by Vips.
    log_response = img[0].conv(log_kernel)

    for ii in range(len(img)):
        img_filtered = img[ii+1].conv(log_kernel)
        log_response = (img_filtered > log_response).ifthenelse(img_filtered, log_response)
        fmap = (img_filtered > log_response).ifthenelse(ii+1, 0)

逻辑索引是通过ifthenelse方法实现的：

^{pr2}$

语法相当灵活。测试条件可以是相同大小的两个图像之间的比较，或者图像和值之间的比较，例如img1 > img2或{}。与wise一样，value_if_true可以是单个值或VIP图像。在

网友

2楼 · 编辑于 2024-05-13 22:10:00

log_response和fmap在问题代码中初始化为3D数组，而问题文本声明输出fmap是一个2D数组。所以，我假设log_response和fmap被初始化为2D数组，它们的形状与每个图像相同。因此，编辑将是-

log_response = np.zeros_like(img[:,:,0], dtype='single')
fmap = np.zeros_like(img[:,:,0], dtype='uint8')

现在，回到问题的主题，您将逐个对每个图像执行二维过滤，并获得所有堆叠图像的过滤输出的最大索引。在这种情况下，根据^{}的文档，它也可以用于多维数组，并将多维数组作为输出。然后，获得所有图像的最大索引很简单.argmax(2)。因此，实施必须非常有效，并且将简单地-

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章