基于值在Python字典列表中查找重复项

9 投票
3 回答
11721 浏览
提问于 2025-04-17 17:11

我有一个字典的列表:

a =[{'id': 1,'desc': 'smth'},
    {'id': 2,'desc': 'smthelse'},
    {'id': 1,'desc': 'smthelse2'},
    {'id': 1,'desc': 'smthelse3'}]

我想遍历这个列表,找到那些有相同的 id 值(比如说 id=1)的字典,并创建一个新的字典:

b = [{'id':1, 'desc' : [smth, smthelse2,smthelse3]}, 
     {'id': 2, 'desc': 'smthelse'}]

3 个回答

0
from collections import defaultdict

d = defaultdict(list)
for x in a:
    d[x['id']].append(x['desc']) # group description by id
b = [dict(id=id, desc=desc if len(desc) > 1 else desc[0])
     for id, desc in d.items()]
b = []
for id in (x['id'] for x in a):
    desc = d[id]
    if desc:
       b.append(dict(id=id, desc=desc if len(desc) > 1 else desc[0]))
       del d[id]

为了保持顺序:

11

你可以试试:

import operator, itertools

key = operator.itemgetter('id')

b = [{'id': x, 'desc': [d['desc'] for d in y]} 
     for x, y in itertools.groupby(sorted(a, key=key), key=key)]
3

最好在任何地方都把“desc”的值保持为列表,即使它们只包含一个元素。这样你就可以这样做:

for d in b:
    print d['id']
    for desc in d['desc']:
        print desc

这同样适用于字符串,只是返回单个字符,这并不是你想要的结果。

现在,解决方案会给你一个包含字典的列表,每个字典里又是一个列表:

a =[{'id': 1,'desc': 'smth'},{'id': 2,'desc': 'smthelse'},{'id': 1,'desc': 'smthelse2'},{'id': 1,'desc': 'smthelse3'}]

c = {}
for d in a:
    c.setdefault(d['id'], []).append(d['desc'])
b = [{'id': k, 'desc': v} for k,v in c.iteritems()]

b 现在是:

[{'desc': ['smth', 'smthelse2', 'smthelse3'], 'id': 1},
 {'desc': ['smthelse'], 'id': 2}]

撰写回答