在python中，将许多独立的、昂贵的操作分发到多个内核上

2条回答

网友
1楼 · 编辑于 2024-06-09 15:31:05

这听起来是^{}的一个很好的用例；根据您正在做什么，它可以简单到
pool = multiprocessing.Pool(num_procs) results = pool.map(the_function, list_of_objects) pool.close()
这将独立地pickle列表中的每个对象。如果这是一个问题，有很多方法可以解决这个问题（尽管它们都有自己的问题，我不知道它们是否可以在Windows上运行）。因为你的计算时间相当长，这可能是无关紧要的。在
因为您要运行5分钟x1000个项目=几天/核心数量，所以您可能需要保存一些部分结果，并打印出一些进度信息。最简单的方法可能是让您调用的函数将其结果保存到文件或数据库或其他任何地方；如果这不实际，您还可以在循环中使用apply_async并在结果出现时处理它们。在
您也可以研究类似joblib的东西来为您处理这个问题；我不太熟悉它，但它似乎正在处理相同的问题。在

网友
2楼 · 编辑于 2024-06-09 15:31:05

如果您想在一台计算机上运行作业，请使用@Dougal在他的答案中建议的multiprocessing.Pool()。在
如果您想让多台计算机处理这个问题，Python也可以这样做。我在谷歌上搜索“python并行处理”后发现：
Parallel Processing in python
其中一个答案推荐“mincemeat”，一个在一个377行Python源文件中的map/reduce解决方案！在
https://github.com/michaelfairley/mincemeatpy
我敢打赌，如果您想在多台计算机上使用多个核心，那么您可以使用multiprocessing.Pool()来启动一组mincemeat客户机。在
编辑：我今晚做了更多的研究，看来芹菜是个不错的选择。芹菜已经可以在每台机器上运行多个工人。在
http://www.celeryproject.org/
这里推荐芹菜：
https://stackoverflow.com/questions/8232194/pros-and-cons-of-celery-vs-disco-vs-hadoop-vs-other-distributed-computing-packag

相关问题更多 >

编程相关推荐

热门问题

热门文章