识别列表中连续重复项的最Pythonic方法是什么？

41 投票

1 回答

22682 浏览

提问于 2025-04-16 19:35

我有一个整数列表，我想找出连续重复的块，也就是说，我想生成一个保持顺序的列表，每个元素是一个二元组，包含（当前整数，出现的次数）。

比如，如果我有这样的列表：

[0, 0, 0, 3, 3, 2, 5, 2, 6, 6]

我希望得到的结果是：

[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

我有一种比较简单的方法可以做到这一点，使用一个for循环、一个临时变量和一个计数器：

result_list = []
current = source_list[0]
count = 0
for value in source_list:
    if value == current:
        count += 1
    else:
        result_list.append((current, count))
        current = value
        count = 1
result_list.append((current, count))

但是我其实更喜欢Python的函数式编程风格，想用一个简单的生成器表达式来实现这个功能。不过我发现，在使用生成器的时候，保持子计数有点困难。我觉得可能需要一个两步的过程才能解决这个问题，但现在我还没想到办法。

有没有特别优雅或者符合Python风格的方法来做到这一点，尤其是使用生成器的时候？

数据结构二元组函数式编程算法优化生成器表达式列表处理计数器连续重复项

1 个回答

>>> from itertools import groupby
>>> L = [0, 0, 0, 3, 3, 2, 5, 2, 6, 6]
>>> grouped_L = [(k, sum(1 for i in g)) for k,g in groupby(L)]
>>> # Or (k, len(list(g))), but that creates an intermediate list
>>> grouped_L
[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

就像他们说的那样，“自带电池”。

这是一个关于如何使用 sum 和生成器表达式的建议，来自 JBernardo；可以看看评论。

回答于 2025-04-16 由 Python大师

分享举报

识别列表中连续重复项的最Pythonic方法是什么？

1 个回答

撰写回答