Python: 快速寻找主要由零填充的大型4D数组的平均值

2024-04-26 00:32:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我有许多大型4D阵列,我想采取的平均值。这些数组大多用零(>;99%)填充,但每个数组在不同的位置都有非零值。每个数组也有一个相应的数组,用于对其进行加权以获取平均值。你知道吗

以一种简单的方式计算数组的平均值(如下所示)需要很长的计算时间,并且常常会导致内存错误。你知道吗

>>> a, b, weights_a, weights_b = [np.zeros((150,150,150,150)) for i in range(4)]

>>> valInds_a = np.random.randint(0,a.size,7000)
>>> valInds_b = np.random.randint(0,b.size,7000)

>>> a.ravel()[valInds_a] = np.random.random(7000)
>>> weights_a.ravel()[valInds_a] = np.random.random(7000)
>>> b.ravel()[valInds_b] = np.random.random(7000)
>>> weights_b.ravel()[valInds_b] = np.random.random(7000)

>>> avg = np.average([a,b],0, weights = [weights_a,weights_b])

我正在寻找一种更快的方法来计算这个意思。我想可能有办法,因为大多数值都是零。我考虑过使用稀疏数组,但它们不支持二维以上的数组。你知道吗


Tags: 内存gtsize错误np方式时间zeros
1条回答
网友
1楼 · 发布于 2024-04-26 00:32:36

一种方法是只取ab非零时的平均值,因为我们知道,否则平均值将为零。你知道吗

如果您有权访问valInds_avalInds_b,可以这样做:

valInds_both = np.union1d(valInds_a, valInds_b)
avg = np.zeros_like(a)
avg.ravel()[valInds_both] = np.average(
    [a.ravel()[valInds_both], b.ravel()[valInds_both]],
    axis=0,
    weights=[weights_a.ravel()[valInds_both], weights_b.ravel()[valInds_both]])

相关问题 更多 >