在纯NumPy中重写for循环以减少执行时间问题的回答

在纯NumPy中重写for循环以减少执行时间

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我<a href="https://stackoverflow.com/questions/2586749/what-is-the-most-platform-and-python-version-independent-way-to-make-a-fast-loop" title="StackOverflow: What is the most platform- and Python-version-independent way to make a fast loop for use in Python?">recently asked about trying to optimise a Python loop for a scientific application</a>，为我收到了{a2}！在 但是，<code>B</code>值的计算实际上嵌套在其他几个循环中，因为它是在规则的位置网格上计算的。是否有一个类似的聪明的NumPy重写来缩短这个过程的时间？在 我怀疑此部件的性能增益不会太明显，缺点可能是无法向用户报告计算进度，计算结果在计算结束前无法写入输出文件，可能一个巨大的步骤做这个会对记忆产生影响吗？有没有可能绕过其中任何一个？在 <pre><code>import numpy as np import time def reshape_vector(v): b = np.empty((3,1)) for i in range(3): b[i][0] = v[i] return b def unit_vectors(r): return r / np.sqrt((r*r).sum(0)) def calculate_dipole(mu, r_i, mom_i): relative = mu - r_i r_unit = unit_vectors(relative) A = 1e-7 num = A*(3*np.sum(mom_i*r_unit, 0)*r_unit - mom_i) den = np.sqrt(np.sum(relative*relative, 0))**3 B = np.sum(num/den, 1) return B N = 20000 # number of dipoles r_i = np.random.random((3,N)) # positions of dipoles mom_i = np.random.random((3,N)) # moments of dipoles a = np.random.random((3,3)) # three basis vectors for this crystal n = [10,10,10] # points at which to evaluate sum gamma_mu = 135.5 # a constant t_start = time.clock() for i in range(n[0]): r_frac_x = np.float(i)/np.float(n[0]) r_test_x = r_frac_x * a[0] for j in range(n[1]): r_frac_y = np.float(j)/np.float(n[1]) r_test_y = r_frac_y * a[1] for k in range(n[2]): r_frac_z = np.float(k)/np.float(n[2]) r_test = r_test_x +r_test_y + r_frac_z * a[2] r_test_fast = reshape_vector(r_test) B = calculate_dipole(r_test_fast, r_i, mom_i) omega = gamma_mu*np.sqrt(np.dot(B,B)) # write r_test, B and omega to a file frac_done = np.float(i+1)/(n[0]+1) t_elapsed = (time.clock()-t_start) t_remain = (1-frac_done)*t_elapsed/frac_done print frac_done*100,'% done in',t_elapsed/60.,'minutes...approximately',t_remain/60.,'minutes remaining' </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

你可以做的一件很明显的事情就是更换线路 <pre><code>r_test_fast = reshape_vector(r_test) </code></pre> 与 ^{pr2}$ 也许在性能上不会有什么大的不同，但无论如何，使用纽普的内置而不是重新设计轮子是有意义的。在 一般来说，正如您现在可能已经注意到的，优化numpy的诀窍是借助numpy整个数组操作来表达算法，或者至少用切片来表示，而不是迭代python代码中的每个元素。阻止这种“矢量化”的是所谓的循环携带依赖关系，即每次迭代都依赖于前一次迭代的结果的循环。简单地看一下你的代码，你没有这样的东西，应该可以很好地将你的代码矢量化。在 编辑：一个解决方案 我还没有证实这是正确的，但应该告诉你如何处理它。在 首先，取<a href="https://stackoverflow.com/questions/1208118/using-numpy-to-build-an-array-of-all-combinations-of-two-arrays">cartesian() function, which we'll use</a>。那么 <pre> <code> def calculate_dipole_vect(mus, r_i, mom_i): # Treat each mu sequentially Bs = [] omega = [] for mu in mus: rel = mu - r_i r_norm = np.sqrt((rel * rel).sum(1)) r_unit = rel / r_norm[:, np.newaxis] A = 1e-7 num = A*(3*np.sum(mom_i * r_unit, 0)*r_unit - mom_i) den = r_norm ** 3 B = np.sum(num / den[:, np.newaxis], 0) Bs.append(B) omega.append(gamma_mu * np.sqrt(np.dot(B, B))) return Bs, omega # Transpose to get more "natural" ordering with row-major numpy r_i = r_i.T mom_i = mom_i.T t_start = time.clock() r_frac = cartesian((np.arange(n[0]) / float(n[0]), np.arange(n[1]) / float(n[1]), np.arange(n[2]) / float(n[2]))) r_test = np.dot(r_frac, a) B, omega = calculate_dipole_vect(r_test, r_i, mom_i) print 'Total time for vectorized: %f s' % (time.clock() - t_start) </code> </pre> 好吧，在我的测试中，这实际上比我开始的基于循环的方法稍微慢一些。问题是，在这个问题的原始版本中，它已经通过对shape（20000，3）数组的整个数组操作进行矢量化，所以任何进一步的矢量化都不会带来更多的好处。事实上，如上所述，它可能会使性能恶化，可能是因为大型临时阵列。在

在纯NumPy中重写for循环以减少执行时间

1 个回答

相关Python问题