如何合并嵌套元组

5 投票

3 回答

1836 浏览

提问于 2025-04-16 23:49

我有一组嵌套的元组：

('id', ('name', ('name_float_fml',)), ('user', ('email',)), ('user', ('last_login',)))

我想把有相似前缀的列表合并，结果应该是：

('id', ('name', ('name_float_fml',)), ('user', ('email','last_login')))

这是另一个例子：

(('baz', ('bing', ('fizz', 'frozz', ('frazz', ('fry', 'bleep', 'blop'))))), ('baz', ('zap', ('zang',))), 'foo', 'bar')

会合并成：

(('baz', (('bing', ('fizz', 'frozz', ('frazz', ('fry', 'bleep', 'blop')))), ('zap', ('zang')))), 'foo', 'bar')

这些元组是用来存储从根节点到树叶的路径：

'baz' -> 'bing' -> 'fizz'，也就是 ('baz' ('bing' ('fizz,)))
'baz' -> 'zap' -> 'zang'，也就是 ('baz' ('zap', ('zang',)))
'baz' -> 'bing' -> 'frazz' -> 'blop'，也就是 ('baz', ('bing', ('frazz', ('blop,))))

我想合并那些通过相同路径到达的叶子元素。希望这样能让你更明白我的意思。

我写了一些代码来实现这个功能，但代码看起来很丑，冗长，而且可能不太稳定。有没有什么通用、简洁或者高效的方法来做到这一点？我想可能有一些我不知道的 itertools 的神奇用法，可以提供一个优雅的解决方案。

注意：我使用的是 Python 2.4

数据处理编程技巧树形结构算法优化代码简化嵌套数据结构元组合并路径合并

3 个回答

这里有一个递归函数可以用来实现这个功能：

def merge(x, bases = (tuple, list)):
    for e in x:
        if type(e) in bases:
            for e in merge(e, bases):
                yield e
        else:
            yield e

tup = (0, (1, 3, 2), [5, (7, 2)])

print list(merge(tup))
# [0, 1, 3, 2, 5, 7, 2]

回答于 2025-04-16 由 Python大师

分享举报

这里有一个使用 itertools.groupby 的解决方案：

from itertools import groupby
def combine(tuples):
    rlist = [tuples[0]]
    for k, g in groupby(tuples[1:], key=lambda t: t[0]):
        rlist.append(tuple((k, tuple(gg[1:][0][0] for gg in g))))
    return tuple(rlist)

sample = ('id', ('name', ('name_float_fml',)), ('user', ('email',)), ('user', ('last_login',)))
print combine(sample)
# ('id', ('name', ('name_float_fml',)), ('user', ('email', 'last_login')))

对于比你问题中给出的示例更复杂的情况，可能可以递归地应用这个过程。

回答于 2025-04-16 由 Python大师

分享举报

这里有一个适合你提供的例子的版本：

a = ('id', ('name', ('name_float_fml',)), ('user', ('email',)), ('user', ('last_login',)))
b = (('baz', ('bing', ('fizz', 'frozz',('frazz', ('fry', 'bleep', 'blop'))))), ('baz', ('zap', ('zang',))), 'foo', 'bar')

def preserve_path(value):
    if len(value) == 2 and isinstance(value[1], (list, tuple)):
        return [value]
    else:
        return value

def flatten_group(my_list):
    d = {}
    for item in my_list:
        # Only items with one string, followed by one tuple represent a path
        # segment. In all other situations, strings are leaves.
        if isinstance(item, (list, tuple)) and len(item) == 2:
            key, value = item
            if key in d:
                d[key].extend(flatten_group(preserve_path(value)))
            else:
                d[key] = preserve_path(list(flatten_group(value)))
        else:
            yield item

    for item in d.iteritems():
        yield item

print list(flatten_group(a))
# ['id', ('name', ['name_float_fml']), ('user', ['email', 'last_login'])]
print list(flatten_group(b))
# ['foo', 'bar', ('baz', [['bing', ('fizz', 'frozz', ('frazz', ('fry', 'bleep', 'blop')))], ('zap', ['zang'])])]

编辑 3：更新了一个合作版本，这个版本可以同时适用于两个例子，并且考虑了你的限制条件：它只处理那些是元组或列表，并且包含两个元素的项。这样也避免了合并后的项被进一步展开。

回答于 2025-04-16 由 Python大师

分享举报

如何合并嵌套元组

3 个回答

撰写回答