为什么我的平行化方法不能扩展？

def dowork(args): uid = int(args.get('uid')) if map_userid_visits.get(uid): map_userid_visits[uid] += 1 else: map_userid_visits[uid] = 1 def main(): manager = Manager() map_userid_visits = manager.dict() start_time = time.time() print ('Start Time', start_time) cur = cursor.Cursor(mycollection) pool = multiprocessing.Pool(CONFIG_POOL_SIZE) iteration = 0 for user_event in cur: pool.apply(dowork, (user_event, )) pool.close() pool.join() print map_userid_visits

1条回答

网友

1楼 · 发布于 2024-06-02 04:56:55

你的方法无法扩展。主要的问题是一次只发送一行，这样就可以做一个非常轻量级的操作。这意味着序列化开销远远大于工作本身

同样来自multiprocessing documentation：

apply(func[, args[, kwds]])¶
Call func with arguments args and keyword arguments kwds. It blocks until the result is ready. Given this blocks, apply_async() is better suited for performing work in parallel. Additionally, func is only executed in one of the workers of the pool.

相关问题更多 >

编程相关推荐

热门问题

热门文章