对两个列表的操作

7 投票

3 回答

957 浏览

提问于 2025-04-17 13:55

让我先给你一些背景信息。

假设我有这样一个列表：

interactions = [ ['O1', 'O3'],
               ['O2', 'O5'],
               ['O8', 'O10']
               ['P3', 'P5'],
               ['P2', 'P19'],
               ['P1', 'P6'] ]

列表中的每一项（比如：O1, O3）代表两个实体之间的互动（虽然我们这里处理的都是字符串）。这个列表里有很多不同的实体。

我们还有另一个列表：

similar = ['O1', 'P23'],
          ['O3', 'P50'],
          ['P2', 'O40'],
          ['P19', 'O22']

这个列表中的每一项是两个不同实体之间的相似关系。

比如说O1和P23相似，O3和P50相似，并且因为[O1, O3]之间有互动，所以这个互动['P23', 'P50']就是一个转化后的互动。

同样，P2和O40相似，P19和O22相似，并且因为[P2, P19]之间有互动，所以这个互动['O40', 'O22']也是一个转化后的互动。

这些转化后的互动总是来自同一种类型，比如：[PX, PX]或者[OX, OX]。

代码

所以我写了以下代码来生成这些关系转化：

from collections import defaultdict

interactions = [ ['O1', 'O3'],
                 ['O2', 'O5'],
                 ['O8', 'O10']
                 ['P3', 'P5'],
                 ['P2', 'P19'],
                 ['P1', 'P6'] ]

similar = [ ['O1', 'H33'],
            ['O6', 'O9'],
            ['O4', 'H1'],
            ['O2', 'H12'] ]

def list_of_lists_to_dict(list_of_lists):
  d = defaultdict(list)
  for sublist in list_of_lists:
    d[sublist[0]].append(sublist[1])
    d[sublist[1]].append(sublist[0])
  return d

interactions_dict = list_of_lists_to_dict(interactions)
similar_dict = list_of_lists_to_dict(similar)


for key, values in interactions_dict.items():
  print "{0} interacts with: {1}".format(key, ', '.join(values))
    if key in similar_dict:
      print " {0} is similar to: {1}".format(key, ', '.join(similar_dict[key]))
      forward = True
  for value in values:
    if value in similar_dict:
      print " {0} is similar to: {1}".format(value, ', '.join(similar_dict[value]))
      reverse = True
      if forward and reverse:
        print "     thus [{0}, {1}] interact!".format(', '.join(similar_dict[key]), 
         ',  '.join(similar_dict[value]))
  forward = reverse = False

我的尝试确实生成了正确的输出，但也产生了一些不想要的输出。例如，有时它会生成不同类型实体之间的输出：O1, P1，还有在完全相同的实体之间的输出：O1, O1。它还会以不同的形式输出重复的结果，比如：O1, P1和P1, O1 - 这两者意思是一样的，所以我们只想要其中一个。这些都是不想要的行为。

所以我的问题是，我该如何重构我的代码来解决这个问题呢？

谢谢。

代码重构列表操作数据结构输出过滤重复结果实体互动相似关系数据转化

3 个回答

如果你把列表转换成字典，那么你就可以很方便地匹配字典里的键，并获取这些键对应的值。

回答于 2025-04-17 由 Python大师

分享举报

我有一些关于整体算法的建议：

保持一个字典，用来存储所有的相似关系，比如 O1:P23 和 P23:O1 都可以放在这个字典里。
在寻找转换之前，先检查一下互动的两个部分是否都可以被转换，比如 O1 和 O3 必须都在字典的键里。
这样可以防止出现同时列出 O 和 P 的转换，这种情况你说是不想要的结果。
如果你觉得可能会有重复的结果，你还可以保持一个结果的字典来检查。

这些问题中有一些是 J.F. Sebastian 的回答提到的，但我认为你应该关注一下原始字典是怎么构建的，这样会让你更容易得到合理的结果。

回答于 2025-04-17 由 Python大师

分享举报

如果相似性关系既不是对称的，也不是传递的：

from collections import defaultdict
from itertools import product

# entity -> similar entities
d = defaultdict(list) # use `set` if `similar` has duplicate entries
for k, v in similar:
    d[k].append(v)

for a, b in interactions:
    for x, y in product(d[a], d[b]): 
       # a, b interact; a is similar to x, b is similar to y
       #note: filter undesired x, y interactions here
       print x, y # transformed interaction

回答于 2025-04-17 由 Python大师

分享举报

对两个列表的操作

代码

3 个回答

撰写回答