使用列表被排序的事实来加速numpy关联程序

for time_0 in np.nditer(data_0): delta_time = np.subtract(data_1, np.full(data_1.size, time_0)) delta_time = delta_time[delta_time >= 0] delta_time = delta_time[delta_time < time_max]

1条回答

网友

1楼 · 发布于 2024-04-25 16:55:00

这里是一个使用argsort的矢量化方法。它使用了一种类似于避免完全扫描的策略：

import numpy as np

def find_gt(ref, data, incl=True):
    out = np.empty(len(ref) + len(data) + 1, int)
    total = (data, ref) if incl else (ref, data)
    out[1:] = np.argsort(np.concatenate(total), kind='mergesort')
    out[0] = -1
    split = (out < len(data)) if incl else (out >= len(ref))
    if incl:
        out[~split] -= len(data)
        split[0] = False
    return np.maximum.accumulate(np.where(split, -1, out))[split] + 1

def find_intervals(ref, data, span, incl=(True, True)):
    index_min = find_gt(ref, data, incl[0])
    index_max = len(ref) - find_gt(-ref[::-1], -span-data[::-1], incl[1])[::-1]
    return index_min, index_max

ref = np.sort(np.random.randint(0,20000,(10000,)))
data = np.sort(np.random.randint(0,20000,(10000,)))
span = 2

idmn, idmx = find_intervals(ref, data, span, (True, True))

print('checking')
for d,mn,mx in zip(data, idmn, idmx):
    assert mn == len(ref) or ref[mn] >= d
    assert mn == 0 or ref[mn-1] < d
    assert mx == len(ref) or ref[mx] > d+span
    assert mx == 0 or ref[mx-1] <= d+span
print('ok')

它的工作原理是

将两个集合间接排序在一起
一组中的每一次都是另一组中的前一次这是使用maximum.reduce完成的
前面的步骤应用两次，第二次是一组按跨度移动

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用列表被排序的事实来加速numpy关联程序

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >