增长数据集上的KDTree/合并两个KDT

2024-04-19 10:03:04 发布

您现在位置:Python中文网/ 问答频道 /正文

在python语言中,给定S是一个数据集(2D点),T是它的子集。我用cKDTree找到T in S的最近邻:

tree = cKDTree(S)
distances, indices = tree.query(T,2)

现在,我的数据集随着时间增长,所以假设我已经积累了一个额外的数据集S2,我需要知道整个数据集中T2(S2的子集)的最近邻,现在是S&S2的并集。在

我正在寻找一种方法来更新S2的“tree”,而不是每次都在整个数据集中重新计算它。或者,在S2上计算一棵树,然后合并这些树,我想。。。在

注:在我的例子中,T2通常只有1个点,而S&S2相当大(几十万到几十万)。在


Tags: 数据方法in语言tree时间query子集