基于列的子集删除重复项，保持列E中值最高的行&如果值E中的行等于列B中值最高的行

2024-06-16 13:45:58 发布

男 | 程序猿一只，喜欢编程写python代码。

假设我有以下数据帧：

我希望删除基于列A、B和C的重复项，保留列E最高的行。如果列E中的值相同，则保留列D最高的行

因此，上述数据帧将变成：

我在那里看到了答案的开头：python pandas: Remove duplicates by columns A, keeping the row with the highest value in column B但不幸的是，我找不到如何处理，如果E列中的值相同，则保留D列中的最高值：/

（我在一个相当大的数据集上运行此代码）

感谢您的帮助

Tags： columns the 数据答案 in pandas by value

1条回答

网友

1楼 · 发布于 2024-06-16 13:45:58

您可以首先根据E, D标准按降序对帧进行排序，然后删除重复项：

df.sort_values(["E", "D"], ascending=[False, False]).drop_duplicates(subset=list("ABC"))