基于列的子集删除重复项,保持列E中值最高的行&如果值E中的行等于列B中值最高的行

2024-06-16 13:45:58 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有以下数据帧:

A B C D E
3 2 1 4 5
3 2 1 2 3
4 5 6 7 8
4 5 6 9 8
9 3 8 5 4

我希望删除基于列A、B和C的重复项,保留列E最高的行。如果列E中的值相同,则保留列D最高的行

因此,上述数据帧将变成:

A B C D E
3 2 1 4 5
4 5 6 9 8
9 3 8 5 4

我在那里看到了答案的开头:python pandas: Remove duplicates by columns A, keeping the row with the highest value in column B但不幸的是,我找不到如何处理,如果E列中的值相同,则保留D列中的最高值:/

(我在一个相当大的数据集上运行此代码)

感谢您的帮助


Tags: columnsthe数据答案inpandasbyvalue