如何在Python中比较多个元组列表?
我想知道怎么比较多个包含元组的列表,像这样:
[[(1,2), (3,6), (5,3)], [(1,5), (3,5)], [(2,1), (1,8), (3,9)]]
我希望得到的结果是:
[(1,2), (1,5), (1,8)],[(3,6), (3,5), (3,9)]
这意味着我只想要那些x轴的值和其他的匹配的元组。
(5,3) 和 (2,1) 应该被丢掉!
4 个回答
0
在编程中,有时候我们会遇到一些问题,可能是因为代码写得不够好,或者是我们对某些概念理解得不够透彻。比如,有人可能在使用某个库的时候,发现它的某些功能没有按照预期工作。这时候,我们就需要去查找资料,看看有没有人遇到过类似的问题,或者有没有解决方案。
在StackOverflow上,很多人会分享他们遇到的问题和解决办法。你可以在上面找到很多有用的讨论和代码示例,这些都能帮助你更好地理解编程中的各种情况。
记住,编程是一个不断学习的过程,遇到问题是很正常的。只要你愿意去寻找答案,就一定能找到解决的方法。
>>> L=[[(1,2), (3,6), (5,3)], [(1,5), (3,5)], [(2,1), (1,8), (3,9)]]
>>> from collections import defaultdict
>>> from itertools import chain
>>> p = defaultdict(list)
>>> for i in chain.from_iterable(L):
... p[i[0]].append(i)
...
>>> p = {k:v for k,v in p.items() if len(v)>1}
>>> p.values()
[[(1, 2), (1, 5), (1, 8)], [(3, 6), (3, 5), (3, 9)]]
1
也许你在找这样的东西:
l = [[(1,2), (3,6), (5,3)], [(1,5), (3,5)], [(2,1), (1,8), (3,9)]]
output = [l[0][0], l[1][0], l[2][1]], [l[0][1], l[1][1], l[2][2]]
1
一种可能的选择
>>> def group(seq):
for k, v in groupby(sorted(chain(*seq), key = itemgetter(0)), itemgetter(0)):
v = list(v)
if len(v) > 1:
yield v
>>> list(group(some_list))
[[(1, 2), (1, 5), (1, 8)], [(3, 6), (3, 5), (3, 9)]]
另一种受欢迎的选择
>>> from collections import defaultdict
>>> def group(seq):
some_dict = defaultdict(list)
for e in chain(*seq):
some_dict[e[0]].append(e)
return (v for v in some_dict.values() if len(v) > 1)
>>> list(group(some_list))
[[(1, 2), (1, 5), (1, 8)], [(3, 6), (3, 5), (3, 9)]]
那么这两者在示例数据上表现得怎么样呢?
>>> def group_sort(seq):
for k, v in groupby(sorted(chain(*seq), key = itemgetter(0)), itemgetter(0)):
v = list(v)
if len(v) > 1:
yield v
>>> def group_hash(seq):
some_dict = defaultdict(list)
for e in chain(*seq):
some_dict[e[0]].append(e)
return (v for v in some_dict.values() if len(v) > 1)
>>> t1_sort = Timer(stmt="list(group_sort(some_list))", setup = "from __main__ import some_list, group_sort, chain, groupby")
>>> t1_hash = Timer(stmt="list(group_hash(some_list))", setup = "from __main__ import some_list, group_hash,chain, defaultdict")
>>> t1_hash.timeit(100000)
3.340240917954361
>>> t1_sort.timeit(100000)
0.14324535970808938
还有在一个更大的随机列表中呢
>>> some_list = [[sample(range(1000), 2) for _ in range(100)] for _ in range(100)]
>>> t1_sort.timeit(100)
1.3816694363194983
>>> t1_hash.timeit(1000)
34.015403087978484
>>>