提高python对嵌套lis中id循环计数的效率

list_of_IDs = [row[4] for row in massive_nested_list] ### get list of ID numbers list_of_IDs = set(list_of_IDs) ### remove duplicates list_of_IDs = list(list_of_IDs) counter200 = 0 counter100 = 0 for my_ID in list_of_IDs: temp = [row for row in massive_nested_list if row[4] == my_ID] if len(temp) > 200: counter200 += 1 if len(temp) > 100: counter100 += 1

2条回答

网友

1楼 · 编辑于 2024-06-10 11:08:53

使用^{} instance来计算您的id。不需要先收集所有可能的ID。然后您可以从那里整理计数：

from collections import Counter

counts = Counter(row[4] for row in massive_nested_list)
counter100 = counter200 = 0
for id, count in counts.most_common():
    if count >= 200:
        counter200 += 1
    elif count >= 100:
        counter100 += 1
    else:
        break

给定N个嵌套列表中的K个惟一id，您的代码将使用O（KN）个循环来计算所有内容；最坏的情况（K==N）意味着您的解决方案需要二次时间（对于每增加一行，您需要多做N倍的工作）。上面的代码将no一个循环减少到N个项目上，然后将另一个循环减少到K个项目上，使其成为O（N）（线性）算法。你知道吗

网友

2楼 · 编辑于 2024-06-10 11:08:53

最简单的方法是：

temp100 = [row for row in massive_nested_list if row[4] == my_ID and row >= 100 and row < 200]
temp200 = [row for row in massive_nested_list if row[4] == my_ID and row >= 200]

然后你可以去：

len(temp200)

或者

counter200 = len(temp200)

相关问题更多 >

编程相关推荐

热门问题

热门文章