满足条件的列表中的元素序列

2024-05-12 13:13:25 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有这种类型的列表:

#    0   1  2  3   4  5  6  7  8  9   10  11 -- list index
li=[-1, -1, 2, 2, -1, 1, 1, 1, 1, 1, -1, -1 ]   

我想找到下面的索引n的值相同的每个索引。在

我可以(费力地)这样做:

^{pr2}$

印刷品:

5 {1: [5]}
4 {1: [5, 6]}
3 {1: [5, 6, 7]}
2 {1: [5, 6, 7, 8], 2: [2], -1: [0, 10]}

有更好的方法吗?在


Tags: 方法类型列表indexlilist费力印刷品
3条回答

正如raymondhettinger在他的回答中指出的,^{}使检查连续值更容易。如果还枚举列表,则可以保留相应的索引并将其添加到字典中(我使用^{}使函数尽可能短):

from itertools import groupby
from operator import itemgetter
from collections import defaultdict

li = [-1, -1, 2, 2, -1, 1, 1, 1, 1, 1, -1, -1]

def sub_seq(li, n):
    res = defaultdict(list)
    for k, g in groupby(enumerate(li), itemgetter(1)):
        l = list(map(itemgetter(0), g))
        if n <= len(l): res[k] += l[0:len(l)-n+1]
    return res

for i in (5,4,3,2):
    print i, sub_seq(li,i)

哪个打印:

^{pr2}$

如果首先将数据转换为方便的形式,则分析数据通常更容易。在这种情况下,run-length-encoding将是一个很好的起点:

from itertools import groupby, accumulate
from collections import defaultdict

def sub_seq(li, n):
    d = defaultdict(list)
    rle = [(k, len(list(g))) for k, g in groupby(li)]
    endpoints = accumulate(size for k, size in rle)
    for end_index, (value, count) in zip(endpoints, rle):
        for index in range(end_index - count, end_index - n + 1):
            d[value].append(index)
    return dict(d)

我个人认为这更具可读性,构造更少的对象,我猜运行速度更快。

li=[-1, -1, 2, 2, -1, 1, 1, 1, 1, 1, -1, -1 ]

results = []
i = 0
while i < len(li):
    j = i + 1
    while j < len(li) and li[i] == li[j]:
        j += 1
    results.append((i,li[i],j-i))
    i = j

print results #[(0, -1, 2), (2, 2, 2), (4, -1, 1), (5, 1, 5), (10, -1, 2)]

相关问题 更多 >