对两个列表的操作
让我先给你一些背景信息。
假设我有这样一个列表:
interactions = [ ['O1', 'O3'],
['O2', 'O5'],
['O8', 'O10']
['P3', 'P5'],
['P2', 'P19'],
['P1', 'P6'] ]
列表中的每一项(比如:O1, O3
)代表两个实体之间的互动(虽然我们这里处理的都是字符串)。这个列表里有很多不同的实体。
我们还有另一个列表:
similar = ['O1', 'P23'],
['O3', 'P50'],
['P2', 'O40'],
['P19', 'O22']
这个列表中的每一项是两个不同实体之间的相似关系。
比如说O1和P23相似,O3和P50相似,并且因为[O1, O3]之间有互动,所以这个互动['P23', 'P50']就是一个转化后的互动。
同样,P2和O40相似,P19和O22相似,并且因为[P2, P19]之间有互动,所以这个互动['O40', 'O22']也是一个转化后的互动。
这些转化后的互动总是来自同一种类型,比如:[PX, PX]或者[OX, OX]。
代码
所以我写了以下代码来生成这些关系转化:
from collections import defaultdict
interactions = [ ['O1', 'O3'],
['O2', 'O5'],
['O8', 'O10']
['P3', 'P5'],
['P2', 'P19'],
['P1', 'P6'] ]
similar = [ ['O1', 'H33'],
['O6', 'O9'],
['O4', 'H1'],
['O2', 'H12'] ]
def list_of_lists_to_dict(list_of_lists):
d = defaultdict(list)
for sublist in list_of_lists:
d[sublist[0]].append(sublist[1])
d[sublist[1]].append(sublist[0])
return d
interactions_dict = list_of_lists_to_dict(interactions)
similar_dict = list_of_lists_to_dict(similar)
for key, values in interactions_dict.items():
print "{0} interacts with: {1}".format(key, ', '.join(values))
if key in similar_dict:
print " {0} is similar to: {1}".format(key, ', '.join(similar_dict[key]))
forward = True
for value in values:
if value in similar_dict:
print " {0} is similar to: {1}".format(value, ', '.join(similar_dict[value]))
reverse = True
if forward and reverse:
print " thus [{0}, {1}] interact!".format(', '.join(similar_dict[key]),
', '.join(similar_dict[value]))
forward = reverse = False
我的尝试确实生成了正确的输出,但也产生了一些不想要的输出。例如,有时它会生成不同类型实体之间的输出:O1, P1
,还有在完全相同的实体之间的输出:O1, O1
。它还会以不同的形式输出重复的结果,比如:O1, P1
和P1, O1
- 这两者意思是一样的,所以我们只想要其中一个。这些都是不想要的行为。
所以我的问题是,我该如何重构我的代码来解决这个问题呢?
谢谢。
3 个回答
0
如果你把列表转换成字典,那么你就可以很方便地匹配字典里的键,并获取这些键对应的值。
1
我有一些关于整体算法的建议:
- 保持一个字典,用来存储所有的相似关系,比如 O1:P23 和 P23:O1 都可以放在这个字典里。
- 在寻找转换之前,先检查一下互动的两个部分是否都可以被转换,比如 O1 和 O3 必须都在字典的键里。
- 这样可以防止出现同时列出 O 和 P 的转换,这种情况你说是不想要的结果。
- 如果你觉得可能会有重复的结果,你还可以保持一个结果的字典来检查。
这些问题中有一些是 J.F. Sebastian 的回答提到的,但我认为你应该关注一下原始字典是怎么构建的,这样会让你更容易得到合理的结果。
1
如果相似性关系既不是对称的,也不是传递的:
from collections import defaultdict
from itertools import product
# entity -> similar entities
d = defaultdict(list) # use `set` if `similar` has duplicate entries
for k, v in similar:
d[k].append(v)
for a, b in interactions:
for x, y in product(d[a], d[b]):
# a, b interact; a is similar to x, b is similar to y
#note: filter undesired x, y interactions here
print x, y # transformed interaction