如何基于两列删除dataframe中第三列中最大的列来删除重复项？

2024-04-27 02:52:12 发布

男 | 程序猿一只，喜欢编程写python代码。

假设我有一个如下的熊猫数据帧：

df=
A  B  6  2
A  C  4  2
D  F  9  3
K  L  8  9
A  B  4  3
D  F  8  2

如果A列和B列有重复项，我怎么说删除C列最大的列

例如，我们可以看到第1行和第5行有相同的A列和B列

A  B  6  2 (Line 1)
A  B  4  3 (Line 5)

我想删除第1行，因为6大于4

所以我的输出应该是

Tags：数据 df line

1条回答

网友

1楼 · 发布于 2024-04-27 02:52:12

尝试按降序对列进行排序，您需要使用 ^{}

然后使用^{}删除_重复项

df.sort_values(by=['C'],ascending=[True],inplace=True)
df.drop_duplicates(subset=['A','B'],inplace=True)