嵌套循环输出到p中的dict

aDict = {'barcode1': [('barcode1', 184), ('barcode1_mut', 2)], 'barcode2': [('barcode2', 138)], 'barcode3': [('barcode3', 375)]} bList = [(('barcode1', 'mut1'), 184), (('barcode1_mut', 'mut2'), 2), (('barcode2', 'mut3'), 136), (('barcode2', 'mut4'), 1), (('barcode2', 'mut5'), 1), (('barcode3', 'mut6'), 373), (('barcode3', 'mut7'), 2)]

>>>print(result) {'barcode1': {'barcode1': [('mut1', 184)], 'barcode1_mut': [('mut2', 2)]}, 'barcode2': {'barcode2': [('mut3', 136), ('mut4', 1), ('mut5', 1)]}, 'barcode3': {'barcode3': [('mut6', 373), ('mut7', 2)]}}

from collections import defaultdict import multiprocessing as mp def f(uniqueBarcode): mutBarcodeList = [x[0] for x in aDict[uniqueBarcode]] a = filter(lambda x: x[0][0] in mutBarcodeList, bList.items()) d = defaultdict(tuple) b = [(x[0][0], (x[0][1], x[1])) for x in a] for tup in b: d[tup[0]] += (tup[1],) result = {i[0]:[y for y in i[1]] for i in d.items()} return result seqDict={} if __name__=='__main__': cpus = mp.cpu_count() pool = mp.Pool(cpus) for barcode in aDict.keys(): seqDict[barcode] = pool.map(f, [barcode]) if len(seqDict) % 100 == 0: print("Processed {} barcodes".format(len(seqDict))) pool.close() pool.join()

Processed 100 barcodes Processed 100 barcodes Processed 100 barcodes Processed 100 barcodes Processed 100 barcodes Processed 100 barcodes Processed 100 barcodes Processed 100 barcodes Processed 200 barcodes Processed 200 barcodes Processed 200 barcodes Processed 200 barcodes Processed 200 barcodes Processed 200 barcodes Processed 200 barcodes Processed 200 barcodes ...

res={} for key in aDict: if len(aDict[key]) == 1: res[key] = {key:[(a[1],b) for a,b in bList if a[0] == key]} elif len(aDict[key]) > 1: res[key] = {x[0]:[(a[1],b) for a,b in bList if a[0] == x[0]] for x in aDict[key]}

2条回答

网友
1楼 · 编辑于 2024-04-25 02:05:46

首先：将bList转换为dict
bDict = { ('barcode1', 'mut1'): 184, ('barcode1_mut', 'mut2'): 2, ('barcode2', 'mut3'): 136, ('barcode2', 'mut4'): 1, ('barcode2', 'mut5'): 1, ('barcode3', 'mut6'): 373, ('barcode3', 'mut7'): 2}
第二：用相同的条形码组合值。你知道吗
mDict = {} for x, y in bDict.items(): if mDict.get(x[0]) == None: mDict[x[0]] = [(x[1], y)] else: mDict[x[0]].append((x[1], y)) >>>print(mDict) {'barcode1': [('mut1', 184)], 'barcode1_mut': [('mut2', 2)], 'barcode2': [('mut3', 136), ('mut4', 1), ('mut5', 1)], 'barcode3': [('mut6', 373), ('mut7', 2)]}
第三：将结果分配给唯一的条形码。你知道吗
seqDict = {x: {y[0]: mDict[y[0]] for y in aDict[x]} for x in aDict.keys()}

网友
2楼 · 编辑于 2024-04-25 02:05:46

我在你的代码中看到很多for循环。这会减慢你的程序。以下是一些具有更好运行时的代码：
bcDict = {'TTCTCTTACCGGGTAC':1,'ACCTCTCGAGAATTCA':2,'TGCAGTTCTGTGCATC':3} bcMutCount = [(('TTCTCTTACCGGGTAC', 'ATTCAACA'), 184), (('ACCTCTCGAGAATTCA', 'CATCCCAC'), 136), (('ACCTCTCGAGAATTCA', 'CATGCCAC'), 1), (('ACCTCTCGAGAATTCA', 'CATCCCCC'), 1), (('TGCAGTTCTGTGCATC', 'TCTACATT'), 373), (('TGCAGTTCTGTGCATC', 'ACTGCGCA'), 2)] for key in bcDict: print({key:[(a[1],b) for a,b in bcMutCount if a[0] == key]})
输出：
{'TTCTCTTACCGGGTAC': [('ATTCAACA', 184)]} {'ACCTCTCGAGAATTCA': [('CATCCCAC', 136), ('CATGCCAC', 1), ('CATCCCCC', 1)]} {'TGCAGTTCTGTGCATC': [('TCTACATT', 373), ('ACTGCGCA', 2)]}
如果这不是你想要的，请纠正我。上面的代码应该在O（m*n）中运行，其中m是bcDict中的键数，n是bcMutCount的长度。这个速度够快吗？你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章