为什么我的并行代码比顺序代码慢？

def apply_async(t): worker = mp.Pool(processes = 4) for i in range(4): X[:,i,np.newaxis], b[:,i,np.newaxis] = worker.apply_async(OULtraining, args=(train[t,i], X[:,i,np.newaxis], b[:,i,np.newaxis])).get() worker.close() worker.join() for t in range(p,T): count = 0 for l in range(p): for k in range(4): gn[count]=train[t-l-1,k] count+=1 G = G*v + gn @ gn.T Gt = (1/(t-p+1))*G if __name__ == '__main__': apply_async(t)

1条回答

网友

1楼 · 发布于 2024-06-11 16:20:54

原因是，你的程序实际上是连续的。这是一个从并行角度来看与您的代码片段相同的示例代码片段：

from multiprocessing import Pool
from time import sleep

def gwork( qq):
    print (qq)
    sleep(1)
    return 42

p = Pool(processes=4)

for q in range(1, 10):
    p.apply_async(gwork, args=(q,)).get()
p.close()
p.join()

运行这个程序，你会发现数字1-9一秒钟出现一次。为什么会这样？原因是你的.get()。这意味着每次调用apply\u async都将在get()中的实践块中执行，直到结果可用为止。它将提交一个任务，等待第二个模拟处理延迟，然后返回结果，然后将另一个任务提交到池中。这意味着根本不存在并行执行。在

尝试使用以下内容替换池管理部件：

^{pr2}$

您现在可以看到并行工作，因为您的四个任务现在是同时处理的。循环不会在get中阻塞，因为get被移出循环，只有当结果准备好时才会收到结果。在

注意：如果你给你的worker的参数或者它们的返回值是大的数据结构，你会损失一些性能。在实践中，Python将这些作为队列来实现，通过队列传输大量数据相对于在分支子进程时获取数据结构的内存副本要慢得多。在

相关问题更多 >

编程相关推荐

热门问题

热门文章