如何并行化两个迭代器？

spectra_names, condensed_distance_matrix, index_0 = [], [], 0 for index_1, index_2 in itertools.combinations(range(len(clusters)), 2): if index_0 == index_1: index_0 += 1 spectra_names.append(clusters[index_1].get_names()[0]) try: distance = 1/float(compare_clusters(clusters[index_1], clusters[index_2],maxiter=50)) except: distance = 10 condensed_distance_matrix.append(distance)

2条回答

网友

1楼 · 编辑于 2024-05-23 17:51:34

如果我正确地理解了您的代码，那么下面的代码应该可以工作

from multiprocessing import Pool
condensed_distance_matrix = []
spectra_names = []
index_0 = 0
cluster_pairs = []
for index_1, index_2 in itertools.combinations(range(len(clusters)), 2):
    if index_0 == index_1:
        index_0 += 1
        spectra_names.append(clusters[index_1].get_names()[0])
    cluster_pairs.append((clusters[index_1], clusters[index_2]))
pool = Pool()
condensed_distance_matrix_values = pool.map(compare_clusters, cluster_pairs)

for value in condensed_distance_matrix_values :
    try:
        distance = 1/float(value)
    except:
        distance = 10
    condensed_distance_matrix.append(distance)

因此，与其创建包含单个集群的两个列表，不如创建一个包含集群对元组的列表。新列表中的每个对都是要比较的群集对。您可能需要相应地调整compare_clusters函数。在

考虑到Blckknght的答案，您不需要迭代索引来创建itertools.combinations的对列表。所以您可以只做pool.map(compare_clusters, itertools.combinations(clusters, 2))，因为组合已经返回元组列表。在

网友

2楼 · 编辑于 2024-05-23 17:51:34

在Python3.3及更高版本中，可以使用pool.starmap。在早期版本中，您需要编写一个helper函数：

def do_comparison(tupl):
    x, y = tupl # unpack arguments
    return compare_clusters(x, y)

pool = Pool()
values = pool.map(do_comparison, itertools.combinations(clusters, 2))
condensed_distance_matrix = [1 / float(v) if v != 0 else 10 for v in values]

我完全避免了索引，而是直接生成2元组的集群值，从而简化了许多事情。您根本不需要top for循环。我还将反转代码简化为一个列表理解，而不是一个每个项目调用一次append的循环。在

当然，您在循环中所做的另一件事是提取spectra_names的值。与其一次只做一个索引，我建议使用列表理解一次性构建所有索引（它可以与上面的池内容分开）：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章