如何基于两列删除dataframe中第三列中最大的列来删除重复项?

2024-04-27 02:52:12 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有一个如下的熊猫数据帧:

df=
A  B  6  2
A  C  4  2
D  F  9  3
K  L  8  9
A  B  4  3
D  F  8  2

如果A列和B列有重复项,我怎么说删除C列最大的列

例如,我们可以看到第1行和第5行有相同的A列和B列

A  B  6  2 (Line 1)
A  B  4  3 (Line 5)

我想删除第1行,因为6大于4

所以我的输出应该是

A  C  4  2
K  L  8  9
A  B  4  3
D  F  8  2

Tags: 数据dfline
1条回答
网友
1楼 · 发布于 2024-04-27 02:52:12

尝试按降序对列进行排序,您需要使用 ^{}

然后使用^{}删除_重复项

df.sort_values(by=['C'],ascending=[True],inplace=True)
df.drop_duplicates(subset=['A','B'],inplace=True)

相关问题 更多 >