使用哈希比较列表中的相似性？

2条回答

网友

1楼 · 编辑于 2024-05-19 01:05:14

如果两个列表中没有重复项，则可以使用集合，集合在内部使用哈希-

>>> L1 = {'milk', 'butter', 'bread', 'shampoo', 'dog food'}
>>> L2 = {'milk', 'butter', 'shampoo', 'dog food', 'coffee'}
>>> L1 & L2
{'dog food', 'butter', 'shampoo', 'milk'}

如果需要处理重复项，Python有一个^{}形式的multiset，它的交集操作执行您期望的操作：

>>> from collections import Counter
>>> Counter(L1) & Counter(L2)
Counter({'butter': 1, 'milk': 1, 'shampoo': 1, 'dog food': 1})

若要获取“x%in common”字符串，需要将交叉点中的元素总数与开始时的元素数进行比较。集合以列表的方式支持len()，因此如果没有重复项，则获取公共项的数量只是len(L1 & L2)。计算一个计数器的长度只会得到distinct元素的数量-当L1和L2是计数器时，要计算出元素的多重数，可以执行以下操作：

 common = L1 & L2
 num_in_common = sum(common.values())

网友

2楼 · 编辑于 2024-05-19 01:05:14

这正是集合的工作原理。将列表转换为集合，然后可以使用并集/交集

S1 = set(L1)
S2 = set(L2)
result = S1.intersection(S2)

但这并不能维持秩序。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用哈希比较列表中的相似性？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >