Python |删除数组中的镜像对

2024-04-27 04:24:34 发布

您现在位置:Python中文网/ 问答频道 /正文

在python中,我有一个形状为n*2的数组(其中n是一个正整数)。本质上,这是一个对数组。我想删除这个数组中的所有镜像对。例如,下面的数组A的形状是10*2。这对[0,55][55,0]将构成A中的一个这样的镜像对,我希望在这两个镜像对中保留一个。在

A = np.array([[ 0, 55], [ 5, 25], [12, 62], [27,  32], [25, 73], 
              [55, 0], [25, 5], [62, 12], [32, 27], [99, 95]])

对于上述示例,我希望结果数组如下所示:

^{pr2}$

因为有6个唯一对(排除4个镜像对之后)。在

我意识到我可以使用两个嵌套的for循环来实现这一点,但是我希望使用最快的方法来实现这一点,因为对于手头的实际问题,我将处理巨大的数组。我会很感激你的帮助。在


Tags: 方法示例for镜像np数组array形状
3条回答

如果您使用的是纯python列表,请尝试以下代码。在

>>> list(set([tuple(i) for i in map(sorted, b)]))
[(27, 32), (5, 25), (12, 62), (95, 99), (25, 73), (0, 55)]

我假设对的顺序无关紧要(例如:[1,2]=[2,1])。如果是这种情况,可以翻转所有对,以便第一个数字始终小于第二个数字。在

[[1,2], [4,3], [1,7], [10,2]] 

变成

^{pr2}$

然后,您可以按第一个数字,然后第二个数字对所有对进行排序:

[[1,2], [1,7], [2,10], [3,4]]

最后,您可以遍历列表并删除任何重复的对。 如果使用高效的排序算法,比如mergesort,整个过程将有O(n*log(n))的工作,这比O(n^2)的工作(嵌套for循环所得到的结果)要好得多。在

神秘的一句话:

In [301]: A
Out[301]: 
array([[ 0, 55],
       [ 5, 25],
       [12, 62],
       [27, 32],
       [25, 73],
       [55,  0],
       [25,  5],
       [62, 12],
       [32, 27],
       [99, 95]])

In [302]: np.unique(np.sort(A, axis=1).view(','.join([A.dtype.char]*2))).view(A.dtype).reshape(-1, 2)
Out[302]: 
array([[ 0, 55],
       [ 5, 25],
       [12, 62],
       [25, 73],
       [27, 32],
       [95, 99]])

把它分成几个步骤。。。在

首先,创建一个沿第二个轴排序的副本。在已排序的数组中,我们要删除重复的行。在

^{pr2}$

numpy.unique()可用于查找数组的唯一元素,但它仅适用于一维数据。因此,我们将创建b的一维视图,其中每一行都成为一个包含两个字段的结构。定义所需的新数据类型的一种方法是将其作为字符串:

In [305]: dt = ','.join([A.dtype.char]*2)

In [306]: dt
Out[306]: 'l,l'

b是一个结构化数组;它是a的一维视图:

In [307]: b = a.view(dt)

In [308]: b
Out[308]: 
array([[( 0, 55)],
       [( 5, 25)],
       [(12, 62)],
       [(27, 32)],
       [(25, 73)],
       [( 0, 55)],
       [( 5, 25)],
       [(12, 62)],
       [(27, 32)],
       [(95, 99)]], 
      dtype=[('f0', '<i8'), ('f1', '<i8')])

现在我们使用numpy.unique()来找到b的唯一元素:

In [309]: u = np.unique(b)

In [310]: u
Out[310]: 
array([( 0, 55), ( 5, 25), (12, 62), (25, 73), (27, 32), (95, 99)], 
      dtype=[('f0', '<i8'), ('f1', '<i8')])

接下来,使用原始数组A的数据类型创建u的视图。这将是一维的:

In [311]: v = u.view(A.dtype)

In [312]: v
Out[312]: array([ 0, 55,  5, 25, 12, 62, 25, 73, 27, 32, 95, 99])

最后,重塑v以恢复二维数组:

In [313]: w = v.reshape(-1, 2)

In [314]: w
Out[314]: 
array([[ 0, 55],
       [ 5, 25],
       [12, 62],
       [25, 73],
       [27, 32],
       [95, 99]])

相关问题 更多 >