删除python中属于相同距离分数的对

nodeA nodeB distance_score 0 0 0 0 1 95 0 2 105 1 0 95 1 1 0 1 2 128 ........

2条回答

网友

1楼 · 编辑于 2024-04-24 11:18:19

另一种方法是使用两个值的冻结集，然后在groupby中使用该值，并获取组中的第一个元素，例如：

df.groupby(df[['nodeA', 'nodeB']].apply(frozenset, axis=1), as_index=False).first()

这将给你：

   nodeA  nodeB  distance_score
0      0      0               0
1      0      1              95
2      0      2             105
3      1      1               0
4      1      2             128

网友

2楼 · 编辑于 2024-04-24 11:18:19

使用`np.sort`和`drop_duplicates`

a = df.values.copy()
a[:, :2] = np.sort(a[:, :2], 1)
pd.DataFrame(a, columns=df.columns).drop_duplicates()

使用`np.unique`和`return_index`参数：

idx = np.unique(np.sort(a[:, :2], 1), axis=0, return_index=True)[1]
df.loc[idx]

在本例中，两者都产生：

   nodeA  nodeB  distance_score
0      0      0               0
1      0      1              95
2      0      2             105
4      1      1               0
5      1      2             128

但是，第一个答案（尽管它总是返回有效的组合）可能返回与原始数据帧不同的行。举个例子：

df = pd.DataFrame({'nodeA': [2], 'nodeB': [0], 'distance_score': [100]})

   nodeA  nodeB  distance_score
0      2      0             100

使用np.sort时：

a = df.values.copy()
a[:, :2] = np.sort(a[:, :2], 1)
pd.DataFrame(a, columns=df.columns).drop_duplicates()

   nodeA  nodeB  distance_score
0      0      2             100

使用np.unique时：

idx = np.unique(np.sort(a[:, :2], 1), axis=0, return_index=True)[1]
df.loc[idx]

   nodeA  nodeB  distance_score
0      2      0             100

如您所见，在本例中，第一种方法将翻转组合顺序。你知道吗

使用`np.sort`和`drop_duplicates`

使用`np.unique`和`return_index`参数：

相关问题更多 >

编程相关推荐

热门问题

热门文章

删除python中属于相同距离分数的对

使用np.sort和drop_duplicates

使用np.unique和return_index参数：

相关问题 更多 >

编程相关推荐

热门问题

热门文章

使用`np.sort`和`drop_duplicates`

使用`np.unique`和`return_index`参数：

相关问题更多 >