有没有更有效的方法来切片多维数组

1条回答

网友

1楼 · 发布于 2024-04-26 22:52:47

对(n, m)数组进行切片的另一种方法是将数组展平并导出它的一维位置。你知道吗

考虑a = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
我们可以用a[1, 2]得到第二行第三列，然后得到5
或者如果我们用order='C'
因此，我们可以使用a.ravel()[1 * a.shape[1] + 2]执行等效切片

这有效率吗？不，对于从数组中索引单个数字来说，不值得这么麻烦。你知道吗

如果我们想从数组中分割许多数字呢？我为二维阵列设计了以下测试

二维测试

from timeit import timeit

n, m = 10000, 10000
a = np.random.rand(n, m)
r = pd.DataFrame(index=np.power(10, np.arange(7)), columns=['Multi', 'Flat'])

for k in r.index:
    b = np.random.randint(n, size=k)
    c = np.random.randint(m, size=k)
    kw = dict(setup='from __main__ import a, b, c', number=100)
    r.loc[k, 'Multi'] = timeit('a[b, c]', **kw)
    r.loc[k, 'Flat'] = timeit('a.ravel()[b * a.shape[1] + c]', **kw)

r.div(r.sum(1), 0).plot.bar()

似乎在切片100000个以上的数字时，最好将数组展平。你知道吗

那3-D
呢三维测试

from timeit import timeit

l, n, m = 1000, 1000, 1000
a = np.random.rand(l, n, m)
r = pd.DataFrame(index=np.power(10, np.arange(7)), columns=['Multi', 'Flat'])

for k in r.index:
    b = np.random.randint(l, size=k)
    c = np.random.randint(m, size=k)
    d = np.random.randint(n, size=k)

    kw = dict(setup='from __main__ import a, b, c, d', number=100)
    r.loc[k, 'Multi'] = timeit('a[b, c, d]', **kw)
    r.loc[k, 'Flat'] = timeit('a.ravel()[b * a.shape[1] * a.shape[2] + c * a.shape[1] + d]', **kw)

r.div(r.sum(1), 0).plot.bar()

类似的结果，也许更具戏剧性。你知道吗

结论对于二维数组，如果需要从数组中提取超过100000个元素，请考虑展平并导出展平位置。你知道吗

对于3维或3维以上的情况，很明显，展平阵列几乎总是更好的。你知道吗

欢迎批评我做错什么了吗？我没想到什么明显的事吗？你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

有没有更有效的方法来切片多维数组

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >