基于值在Python字典列表中查找重复项

9 投票

3 回答

11721 浏览

提问于 2025-04-17 17:11

我有一个字典的列表：

a =[{'id': 1,'desc': 'smth'},
    {'id': 2,'desc': 'smthelse'},
    {'id': 1,'desc': 'smthelse2'},
    {'id': 1,'desc': 'smthelse3'}]

我想遍历这个列表，找到那些有相同的 id 值（比如说 id=1）的字典，并创建一个新的字典：

b = [{'id':1, 'desc' : [smth, smthelse2,smthelse3]}, 
     {'id': 2, 'desc': 'smthelse'}]

数据结构字典重复项查找

3 个回答

from collections import defaultdict

d = defaultdict(list)
for x in a:
    d[x['id']].append(x['desc']) # group description by id
b = [dict(id=id, desc=desc if len(desc) > 1 else desc[0])
     for id, desc in d.items()]

b = []
for id in (x['id'] for x in a):
    desc = d[id]
    if desc:
       b.append(dict(id=id, desc=desc if len(desc) > 1 else desc[0]))
       del d[id]

为了保持顺序：

回答于 2025-04-17 由 Python大师

分享举报

你可以试试：

import operator, itertools

key = operator.itemgetter('id')

b = [{'id': x, 'desc': [d['desc'] for d in y]} 
     for x, y in itertools.groupby(sorted(a, key=key), key=key)]

回答于 2025-04-17 由 Python大师

分享举报

最好在任何地方都把“desc”的值保持为列表，即使它们只包含一个元素。这样你就可以这样做：

for d in b:
    print d['id']
    for desc in d['desc']:
        print desc

这同样适用于字符串，只是返回单个字符，这并不是你想要的结果。

现在，解决方案会给你一个包含字典的列表，每个字典里又是一个列表：

a =[{'id': 1,'desc': 'smth'},{'id': 2,'desc': 'smthelse'},{'id': 1,'desc': 'smthelse2'},{'id': 1,'desc': 'smthelse3'}]

c = {}
for d in a:
    c.setdefault(d['id'], []).append(d['desc'])
b = [{'id': k, 'desc': v} for k,v in c.iteritems()]

b 现在是：

[{'desc': ['smth', 'smthelse2', 'smthelse3'], 'id': 1},
 {'desc': ['smthelse'], 'id': 2}]

回答于 2025-04-17 由 Python大师

分享举报

基于值在Python字典列表中查找重复项

3 个回答

撰写回答