更快的列表居中方式

import random m = range(2000) sm = sorted(random.sample(range(100000), 16000)) si = random.sample(range(16005), 16000) # Centered array. smm = [] print sm print si for i in m: if i in sm: smm.append(si[sm.index(i)]) else: smm.append(None) print m print smm

1条回答

网友

1楼 · 发布于 2024-06-09 08:09:24

您的主循环包含以下臭名昭著的行：

if i in sm:

似乎什么都不是，因为sm是sorted的结果，所以它是一个list，因此O(n)查找，这就解释了为什么它在大数据集上很慢。你知道吗

此外，您正在使用更臭名昭著的si[sm.index(i)]，这使得您的算法O(n**2)。你知道吗

因为您需要索引，所以使用set并不是那么容易，有更好的方法：

由于sm已排序，因此可以使用bisect在O(log(n))中查找索引，如下所示：

for i in m:
    j = bisect.bisect_left(sm,i)
    smm.append(si[j] if (j < len(sm) and sm[j]==i) else None)

小说明：bisect给出了i在sm中的插入点。这并不意味着值实际上在列表中，所以我们必须检查它（通过检查返回值是否在现有列表范围内，并检查返回索引处的值是否是搜索的值），如果是，append，else appendNone。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章