去除数据框架中的重复元素Python - 问答 - Python中文网

去除数据框架中的重复元素Python

2024-04-20 06:08:13 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试删除列“p1”和“p2”中的重复元素，即如果元素已出现在列“p1”中，则它不应再次出现在“p2”或任何后续列中。例如，对于下面的代码，只保留“a b”和“c d”。你知道吗

做这件事的有效方法是什么？你知道吗

import pandas as pd
df = pd.DataFrame({'p1':['a','b','a','a','b','d','c'],
                'p2':['b','a','c','d','c','a','d'],
                'value':[1,1,2,3,5,3,5]})
df

Tags：方法代码 import 元素 dataframe pandas df value

2条回答

网友

1楼 · 编辑于 2024-04-20 06:08:13

Series( pd.DataFrame({'p1':['a','b','a','a','b','d','c'],'p2':['b','a','c','d','c','a','d'],'value':[1,1,2,3,5,3,5]}).values.ravel()).unique()

一旦我的virtualenv中安装了pandas，我就会发布输出。你知道吗

网友

2楼 · 编辑于 2024-04-20 06:08:13

您可以从列value、^{}中首先^{}创建Series、^{}、^{}，最后^{}：

print df.set_index('value').stack().drop_duplicates().unstack().reset_index()
   value    p1 p2
0      1     a  b
1      2  None  c
2      3  None  d

相关问题更多 >

编程相关推荐

热门问题

热门文章