去除数据框架中的重复元素Python

2024-04-20 06:08:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试删除列“p1”和“p2”中的重复元素,即如果元素已出现在列“p1”中,则它不应再次出现在“p2”或任何后续列中。例如,对于下面的代码,只保留“a b”和“c d”。你知道吗

做这件事的有效方法是什么?你知道吗

import pandas as pd
df = pd.DataFrame({'p1':['a','b','a','a','b','d','c'],
                'p2':['b','a','c','d','c','a','d'],
                'value':[1,1,2,3,5,3,5]})
df

Tags: 方法代码import元素dataframepandasdfvalue
2条回答

Series( pd.DataFrame({'p1':['a','b','a','a','b','d','c'],'p2':['b','a','c','d','c','a','d'],'value':[1,1,2,3,5,3,5]}).values.ravel()).unique()

一旦我的virtualenv中安装了pandas,我就会发布输出。你知道吗

您可以从列value^{}中首先^{}创建Series^{}^{},最后^{}

print df.set_index('value').stack().drop_duplicates().unstack().reset_index()
   value    p1 p2
0      1     a  b
1      2  None  c
2      3  None  d

相关问题 更多 >