查找并更新列表中的重复项

['apple', 'window', 'pear', 2, 1.55, 'banana'] ['apple', 'orange', 'kiwi', 3, 1.80, 'banana'] ['apple', 'envelope', 'star_fruit', 2, 1.55, 'banana'] ['apple', 'orange', 'pear', 2, 0.80, 'coffee_cup'] ['apple', 'orange', 'pear', 2, 3.80, 'coffee_cup']

3条回答

网友

1楼 · 编辑于 2024-05-16 12:28:16

以下是我的解决方案（注释代码）：

import itertools

l = [
        ['apple', 'window', 'pear', 2, 1.55, 'banana'],
        ['apple', 'orange', 'kiwi', 3, 1.80, 'banana'],
        ['apple', 'envelope', 'star_fruit', 2, 1.55, 'banana'],
        ['apple', 'orange', 'pear', 2, 0.80, 'coffee_cup'],
        ['apple', 'orange', 'pear', 2, 3.80, 'coffee_cup']
    ]

#Here you can select the important fields 
key = lambda i: (i[0],i[2])

l.sort(key=key)
grp = itertools.groupby(l, key=key)
#Look at itertools documentation
grouped = (list(j) for i,j in grp)

for i in grouped:
    if len(i) == 1:
        i[0].append(0)
    else: #You want duplicates to start from 1
        for pos, item in enumerate(i, 1):
            item.append(pos)

#Just a little loop for flattening the list
result = [] 
for i in grouped:
    for j in i:
        result.append(j)

print(result)

输出：

^{pr2}$

网友

2楼 · 编辑于 2024-05-16 12:28:16

from collections import defaultdict

lists = [['apple', 'window', 'pear', 2, 1.55, 'banana'],
['apple', 'orange', 'kiwi', 3, 1.80, 'banana'],
['apple', 'envelope', 'star_fruit', 2, 1.55, 'banana'],
['apple', 'orange', 'pear', 2, 0.80, 'coffee_cup'],
['apple', 'orange', 'pear', 2, 3.80, 'coffee_cup']]

dic = defaultdict(int)
fts = []
for lst in lists:
    first_third = lst[0], lst[2]
    dic[first_third] += 1
    if dic[first_third] == 2: fts.append(first_third)
    lst.append(dic[first_third])

for lst in lists:
    if (lst[0], lst[2]) not in fts:
        lst[-1] -= 1

print(lists)

编辑：谢谢尤德米尔。first_third = lst[0], lst[2]是正确的，不是{}

编辑2：为了清楚起见，更改了变量名。在

编辑3：为了反映原海报真正想要的，以及他更新的名单。再也不漂亮了，想要的改变只是一种附属品。在

网友

3楼 · 编辑于 2024-05-16 12:28:16

最好的办法是首先使用itemgetter()对列表进行排序，以选择要匹配的字段key。这将导致所有匹配的关键字段显示在一起，以便可以轻松地对它们进行比较和标记。例如，匹配第一个和第三个字段的排序是：

lst.sort(key=itemgetter(0, 2))

每一项与前一项的比较是直截了当的。在

好的，下面是完整的解决方案（使用itemgetter和groupby）：

^{pr2}$

下面是一个示例测试运行以显示用法：

^{3}$

相关问题更多 >

编程相关推荐

热门问题

热门文章