根据重叠项将列表的Python列表分组

网友

1楼 · 编辑于 2024-06-13 05:12:36

只要使用任何现有的聚类算法。说K-均值还是等级？在

http://en.wikipedia.org/wiki/K-means_clustering

http://en.wikipedia.org/wiki/Hierarchical_clustering

网友

2楼 · 编辑于 2024-06-13 05:12:36

与Python中大多数以“我正在尝试按foo分组…”开头的问题一样，答案是“使用^{}和foo作为键。”

首先，让我们采用一个非常简单的分组标准：每个列表的长度。为此，键函数只是len。（您可能还想先sort，可能使用相同的键，这取决于您的数据。）

groups = [list(group) for key, group in itertools.groupby(paths, len)]

有时定义分组标准（因此定义键函数）很难，或者不可能根据每个元素的独立转换来定义。在这些情况下，groupby通常不是答案（尽管groupby加上另一个{}函数仍然可能是）。在

在这种情况下，定义分组标准的最自然的方法是与相邻元素进行比较。最简单的编写方法是编写一个比较两个相邻元素的cmp函数，然后在其上使用^{}：

^{pr2}$

网友

3楼 · 编辑于 2024-06-13 05:12:36

您正在基于集合进行分组，因此请使用集合来检测新组：

def grouper(sequence):
    group, members = [], set()

    for item in sequence:
        if group and members.isdisjoint(item):
            # new group, yield and start new
            yield group
            group, members = [], set()
        group.append(item)
        members.update(item)

    yield group

这样可以得到：

^{pr2}$

或者你可以把它再放到一个列表中：

output = list(grouper(paths))

这假设组是连续的。如果有不相交的组，则需要处理整个列表，并循环到目前为止为每个项构建的所有组：

def grouper(sequence):
    result = []  # will hold (members, group) tuples

    for item in sequence:
        for members, group in result:
            if members.intersection(item):  # overlap
                members.update(item)
                group.append(item)
                break
        else:  # no group found, add new
            result.append((set(item), [item]))

    return [group for members, group in result]

相关问题更多 >

编程相关推荐

热门问题

热门文章