使用Python和Pandas,我希望在一个数据帧中找到所有具有重复行的列,并将它们移动到另一个数据帧。 例如,我可能有:
cats, tigers, 3.5, 1, cars, 2, 5
cats, tigers, 3.5, 6, 7.2, 22.6, 5
cats, tigers, 3.5, test, 2.6, 99, 52.3
我想要猫,老虎,3.5在一个数据框里
cats, tigers, 3.5
在另一个数据帧中
1, cars, 2, 5
6, 7.2, 22.6, 5
test, 2.6, 99, 52.3
代码应该检查每一列的重复行,并且只删除所有行中重复出现的列。你知道吗
我怎么能这么做?你知道吗
方法一:
将
nunique
与dropna=False
一起使用方法2:
使用listcomp并在每个列上检查带有选项
keep=False
的duplicated
,然后检查all
正如@Moys所提到的,如果您只想要
df_dup
中的一行,您可以使用drop_duplicates
或简单地使用.head(1)
或iloc
或者
对于非重复行:
你可以用
输出
以及
输出
相关问题 更多 >
编程相关推荐