Python多处理：如何知道使用池或进程？

def MatrixHelper(self, args): return self.CreateMatrix(*args) def Multiprocess(self, sigmaI, sigmaX): cpus = mp.cpu_count() print('Number of cpu\'s to process WM: %d' % cpus) poolCount = cpus*2 args = [(sigmaI, sigmaX, i) for i in range(self.numPixels)] pool = mp.Pool(processes = poolCount, maxtasksperchild= 2) tempData = pool.map(self.MatrixHelper, args) pool.close() pool.join()

def Multiprocess(self, sigmaI, sigmaX): cpus = mp.cpu_count() print('Number of cpu\'s to process WM: %d' % cpus) processes = [mp.Process(target = self.CreateMatrixMp, args = (sigmaI, sigmaX, i,)) for i in range(self.numPixels)] for p in processes: p.start() for p in processes: p.join()

1条回答

网友

1楼 · 发布于 2024-05-12 23:01:55

我认为Pool类通常更方便，但这取决于您希望结果是有序的还是无序的。

假设要创建4个随机字符串（例如，。可能是一个随机的用户ID生成器，大约是这样的）：

import multiprocessing as mp
import random
import string

# Define an output queue
output = mp.Queue()

# define a example function
def rand_string(length, output):
    """ Generates a random string of numbers, lower- and uppercase chars. """
    rand_str = ''.join(random.choice(
                    string.ascii_lowercase
                    + string.ascii_uppercase
                    + string.digits)
               for i in range(length))
    output.put(rand_str)

# Setup a list of processes that we want to run
processes = [mp.Process(target=rand_string, args=(5, output)) for x in range(4)]

# Run processes
for p in processes:
    p.start()

# Exit the completed processes
for p in processes:
    p.join()

# Get process results from the output queue
results = [output.get() for p in processes]

print(results)

# Output
# ['yzQfA', 'PQpqM', 'SHZYV', 'PSNkD']

在这里，顺序可能无关紧要。我不确定是否有更好的方法来实现这一点，但是如果我想按照调用函数的顺序跟踪结果，我通常会返回以ID作为第一项的元组，例如

# define a example function
def rand_string(length, pos, output):
    """ Generates a random string of numbers, lower- and uppercase chars. """
    rand_str = ''.join(random.choice(
                    string.ascii_lowercase
                    + string.ascii_uppercase
                    + string.digits)
                for i in range(length))
    output.put((pos, rand_str))

# Setup a list of processes that we want to run
processes = [mp.Process(target=rand_string, args=(5, x, output)) for x in range(4)]

print(processes)

# Output
# [(1, '5lUya'), (3, 'QQvLr'), (0, 'KAQo6'), (2, 'nj6Q0')]

接下来让我对结果进行排序：

results.sort()
results = [r[1] for r in results]
print(results)

# Output:
# ['KAQo6', '5lUya', 'nj6Q0', 'QQvLr']

泳池班

现在你的问题是：这与Pool类有什么不同？您通常希望Pool.map返回结果的有序列表，而不必经历创建元组和按I d排序的过程。因此，我认为它通常更有效。

def cube(x):
    return x**3

pool = mp.Pool(processes=4)
results = pool.map(cube, range(1,7))
print(results)

# output:
# [1, 8, 27, 64, 125, 216]

同样，还有一种“应用”方法：

pool = mp.Pool(processes=4)
results = [pool.apply(cube, args=(x,)) for x in range(1,7)]
print(results)

# output:
# [1, 8, 27, 64, 125, 216]

在进程完成之前，Pool.apply和Pool.map都将锁定主程序。

现在，您还有Pool.apply_async和Pool.map_async，它们在进程完成后立即返回结果，这与上面的Process类基本相似。其优点可能是它们为您提供了方便的apply和map功能，您可以从Python的内置apply和map中了解这些功能

泳池班

相关问题更多 >

编程相关推荐

热门问题

热门文章