对两个列表的操作

7 投票
3 回答
957 浏览
提问于 2025-04-17 13:55

让我先给你一些背景信息。

假设我有这样一个列表:

interactions = [ ['O1', 'O3'],
               ['O2', 'O5'],
               ['O8', 'O10']
               ['P3', 'P5'],
               ['P2', 'P19'],
               ['P1', 'P6'] ]

列表中的每一项(比如:O1, O3)代表两个实体之间的互动(虽然我们这里处理的都是字符串)。这个列表里有很多不同的实体。

我们还有另一个列表:

similar = ['O1', 'P23'],
          ['O3', 'P50'],
          ['P2', 'O40'],
          ['P19', 'O22']

这个列表中的每一项是两个不同实体之间的相似关系。

比如说O1P23相似,O3P50相似,并且因为[O1, O3]之间有互动,所以这个互动['P23', 'P50']就是一个转化后的互动。

同样,P2O40相似,P19O22相似,并且因为[P2, P19]之间有互动,所以这个互动['O40', 'O22']也是一个转化后的互动。

这些转化后的互动总是来自同一种类型,比如:[PX, PX]或者[OX, OX]。

代码

所以我写了以下代码来生成这些关系转化:

from collections import defaultdict

interactions = [ ['O1', 'O3'],
                 ['O2', 'O5'],
                 ['O8', 'O10']
                 ['P3', 'P5'],
                 ['P2', 'P19'],
                 ['P1', 'P6'] ]

similar = [ ['O1', 'H33'],
            ['O6', 'O9'],
            ['O4', 'H1'],
            ['O2', 'H12'] ]

def list_of_lists_to_dict(list_of_lists):
  d = defaultdict(list)
  for sublist in list_of_lists:
    d[sublist[0]].append(sublist[1])
    d[sublist[1]].append(sublist[0])
  return d

interactions_dict = list_of_lists_to_dict(interactions)
similar_dict = list_of_lists_to_dict(similar)


for key, values in interactions_dict.items():
  print "{0} interacts with: {1}".format(key, ', '.join(values))
    if key in similar_dict:
      print " {0} is similar to: {1}".format(key, ', '.join(similar_dict[key]))
      forward = True
  for value in values:
    if value in similar_dict:
      print " {0} is similar to: {1}".format(value, ', '.join(similar_dict[value]))
      reverse = True
      if forward and reverse:
        print "     thus [{0}, {1}] interact!".format(', '.join(similar_dict[key]), 
         ',  '.join(similar_dict[value]))
  forward = reverse = False

我的尝试确实生成了正确的输出,但也产生了一些不想要的输出。例如,有时它会生成不同类型实体之间的输出:O1, P1,还有在完全相同的实体之间的输出:O1, O1。它还会以不同的形式输出重复的结果,比如:O1, P1P1, O1 - 这两者意思是一样的,所以我们只想要其中一个。这些都是不想要的行为。

所以我的问题是,我该如何重构我的代码来解决这个问题呢?

谢谢。

3 个回答

0

如果你把列表转换成字典,那么你就可以很方便地匹配字典里的键,并获取这些键对应的值。

1

我有一些关于整体算法的建议:

  • 保持一个字典,用来存储所有的相似关系,比如 O1:P23 和 P23:O1 都可以放在这个字典里。
  • 在寻找转换之前,先检查一下互动的两个部分是否都可以被转换,比如 O1 和 O3 必须都在字典的键里。
  • 这样可以防止出现同时列出 O 和 P 的转换,这种情况你说是不想要的结果。
  • 如果你觉得可能会有重复的结果,你还可以保持一个结果的字典来检查。

这些问题中有一些是 J.F. Sebastian 的回答提到的,但我认为你应该关注一下原始字典是怎么构建的,这样会让你更容易得到合理的结果。

1

如果相似性关系既不是对称的,也不是传递的:

from collections import defaultdict
from itertools import product

# entity -> similar entities
d = defaultdict(list) # use `set` if `similar` has duplicate entries
for k, v in similar:
    d[k].append(v)

for a, b in interactions:
    for x, y in product(d[a], d[b]): 
       # a, b interact; a is similar to x, b is similar to y
       #note: filter undesired x, y interactions here
       print x, y # transformed interaction

撰写回答