初始化和填充numpy数组的最佳方法？

31 投票

5 回答

45846 浏览

提问于 2025-04-17 22:22

我想初始化并填充一个 numpy 数组。有什么好的方法吗？

这个方法按我预期的工作：

>>> import numpy as np
>>> np.empty(3)
array([ -1.28822975e-231,  -1.73060252e-077,   2.23946712e-314])

但这个方法就不行：

>>> np.empty(3).fill(np.nan)
>>>

什么都没有？

>>> type(np.empty(3))
<type 'numpy.ndarray'>

我觉得 np.empty() 这个调用返回的对象类型是对的，所以我不明白为什么 .fill() 不起作用？

先把 np.empty() 的结果赋值给一个变量就可以正常工作：

>>> a = np.empty(3)
>>> a.fill(np.nan)
>>> a
array([ nan,  nan,  nan])

为什么我需要先赋值给一个变量才能使用 np.fill()？我是不是错过了更好的方法？

numpy 编程技巧数据类型变量赋值数组初始化数组填充

5 个回答

如果你不介意使用 None，你可以这样做：

a = np.empty(3, dtype=object)

回答于 2025-04-17 由 Python大师

分享举报

为了将来参考，乘以 np.nan 之所以有效，是因为 np.nan 的数学特性。对于一个普通的值 N，你需要使用 np.ones() * N，这和被接受的答案类似，但从速度上来说，这并不是一个特别好的选择。

最佳选择是 np.full()，正如之前提到的。如果你无法使用这个，np.zeros() + N 比 np.ones() * N 更好，而 np.empty() + N 或 np.empty() * N 则不太合适。需要注意的是，当 N 是 np.nan 时，np.zeros() + N 也能正常工作。

%timeit x = np.full((1000, 1000, 10), 432.4)
8.19 ms ± 97.8 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

%timeit x = np.zeros((1000, 1000, 10)) + 432.4
9.86 ms ± 55.1 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

%timeit x = np.ones((1000, 1000, 10)) * 432.4
17.3 ms ± 104 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

%timeit x = np.array([432.4] * (1000 * 1000 * 10)).reshape((1000, 1000, 10))
316 ms ± 37.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

回答于 2025-04-17 由 Python大师

分享举报

我觉得这个很容易记住：

numpy.array([numpy.nan]*3)

出于好奇，我计时了一下，发现@JoshAdel的回答和@shx2的回答在处理大数组时都比我的快得多。

In [34]: %timeit -n10000 numpy.array([numpy.nan]*10000)
10000 loops, best of 3: 273 µs per loop

In [35]: %timeit -n10000 numpy.empty(10000)* numpy.nan
10000 loops, best of 3: 6.5 µs per loop

In [36]: %timeit -n10000 numpy.full(10000, numpy.nan)
10000 loops, best of 3: 5.42 µs per loop

回答于 2025-04-17 由 Python大师

分享举报

你也可以试试：

In [79]: np.full(3, np.nan)
Out[79]: array([ nan,  nan,  nan])

初始化和填充numpy数组的最佳方法？

5 个回答

撰写回答