在python中有效地知道两个列表的交集是否为空

2024-04-25 10:02:30 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有两个列表,L和M,现在我想知道它们是否共享一个元素。 在python中,哪种方式是询问它们是否共享元素的最快方式? 我不在乎它们共享哪些元素,或者共享多少,只要它们是否共享。

例如,在这种情况下

L = [1,2,3,4,5,6]
M = [8,9,10]

我应该弄错了,这里:

L = [1,2,3,4,5,6]
M = [5,6,7]

我应该相信。

我希望问题是清楚的。 谢谢!

曼纽尔


Tags: 元素列表方式情况
3条回答

首先,如果不需要对它们进行排序,那么切换到set类型。

如果仍然需要列表类型,请按以下方式执行:0==False

len(set.intersection(set(L), set(M)))

或者更简洁

if set(L) & set(M):
    # there is an intersection
else:
    # no intersection

如果你真的需要TrueFalse

bool(set(L) & set(M))

在进行了一些计时之后,这似乎也是一个不错的选择

m_set=set(M)
any(x in m_set  for x in L)

如果M或L中的项不可散列,则必须使用这样一种效率较低的方法

any(x in M for x in L)

下面是100个项目列表的一些计时。当没有交集时,使用集合的速度要快得多,而当有一个相当大的交集时,使用集合的速度要慢得多。

M=range(100)
L=range(100,200)

timeit set(L) & set(M)
10000 loops, best of 3: 32.3 µs per loop

timeit any(x in M for x in L)
1000 loops, best of 3: 374 µs per loop

timeit m_set=frozenset(M);any(x in m_set  for x in L)
10000 loops, best of 3: 31 µs per loop

L=range(50,150)

timeit set(L) & set(M)
10000 loops, best of 3: 18 µs per loop

timeit any(x in M for x in L)
100000 loops, best of 3: 4.88 µs per loop

timeit m_set=frozenset(M);any(x in m_set  for x in L)
100000 loops, best of 3: 9.39 µs per loop


# Now for some random lists
import random
L=[random.randrange(200000) for x in xrange(1000)]
M=[random.randrange(200000) for x in xrange(1000)]

timeit set(L) & set(M)
1000 loops, best of 3: 420 µs per loop

timeit any(x in M for x in L)
10 loops, best of 3: 21.2 ms per loop

timeit m_set=set(M);any(x in m_set  for x in L)
1000 loops, best of 3: 168 µs per loop

timeit m_set=frozenset(M);any(x in m_set  for x in L)
1000 loops, best of 3: 371 µs per loop

为了避免构建交叉点的工作,并在我们知道交叉点后立即给出答案:

m_set = frozenset(M)
return any(x in m_set for x in L)

更新:gnibbler尝试了这个方法,发现使用set()代替frozenset()可以更快地运行。什么事。

相关问题 更多 >