假设我有以下数据帧:
A B C D E
3 2 1 4 5
3 2 1 2 3
4 5 6 7 8
4 5 6 9 8
9 3 8 5 4
我希望删除基于列A、B和C的重复项,保留列E最高的行。如果列E中的值相同,则保留列D最高的行
因此,上述数据帧将变成:
A B C D E
3 2 1 4 5
4 5 6 9 8
9 3 8 5 4
我在那里看到了答案的开头:python pandas: Remove duplicates by columns A, keeping the row with the highest value in column B但不幸的是,我找不到如何处理,如果E列中的值相同,则保留D列中的最高值:/
(我在一个相当大的数据集上运行此代码)
感谢您的帮助
您可以首先根据
E, D
标准按降序对帧进行排序,然后删除重复项:相关问题 更多 >
编程相关推荐