更有效地利用itertools.groupby()

2024-05-23 17:44:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在努力增强我对itertools库的了解,因为它非常有用。为此,我正努力解决我遇到的一个面试难题。其中很大一部分涉及到按顺序计算一个数字中分组和重复的位数。例如,对于数字:

1223444556

我想要:

^{pr2}$

也就是说,从左到右,有1个,2个,1个3,等等。在

以下是我当前的代码:

from itertools import groupby
groups_first = [int(''.join(v)[0]) for k,v in groupby(str(1223444556))]
counts = [len(''.join(v)) for k,v in groupby(str(1223444556))]
zip(counts,groups_first)

它是可行的,但我想知道的是,是否有一种更简洁的方法可以绕过将两个列表压缩在一起。有什么想法吗?我想这可能需要在groupby()中执行某种lambda函数,但我还看不到。在

谢谢!在


Tags: 代码infor顺序数字firstgroupsjoin
3条回答

怎么样:

[(sum(1 for _ in v), int(k)) for k,v in groupby(str(1223444556))]

我可能会选择收藏来代替:

>>> from collections import Counter
>>> c = Counter('1223444556')
>>> c.items()
[('1', 1), ('3', 1), ('2', 2), ('5', 2), ('4', 3), ('6', 1)]

如果顺序很重要(正如您在评论中所说),这可能不再是最有效的方法。但为了充分考虑,您可以这样做:

^{pr2}$

如果你想把y,x列为x,y,你可以这样做:

>>> t = [(y, x) for x, y in t]
>>> print t
[(1, '1'), (2, '2'), (1, '3'), (3, '4'), (2, '5'), (1, '6')]

此方法的一个值是重复元素以字符串形式列出,因此不会混淆哪个数字来自原始列表,哪个数字表示频率。在

我可能只会写信

>>> n = 1223444556
>>> [(len(list(g)), int(k)) for k,g in groupby(str(n))]
[(1, 1), (2, 2), (1, 3), (3, 4), (2, 5), (1, 6)]

相关问题 更多 >