python pandas如何选择性地删除重复项

df1 = pd.DataFrame([['','CCCH'], ['CHC','CCCH'], ['CCHCC','CNHCC'], ['','CCCH'], ['CNHCC','CNOCH'], ['','NCH'], ['','NCH']], columns=['B', 'C']) df1 B C 0 CCCH 1 CHC CCCH 2 CCHCC CNHCC 3 CCCH 4 CNHCC CNOCH 5 NCH 6 NCH

1条回答

网友

1楼 · 发布于 2024-04-20 08:10:31

假设您根据'C'列对数据帧进行分组，并检查每个组是否存在'B'-column非空条目：

如果没有这样的条目，则返回整个组
否则，对于'B'中的非空项返回组，并删除重复项

代码：

def remove_duplicates(g):                                    
    return g if sum(g.B == '') == len(g) else g[g.B != ''].drop_duplicates(subset='B')

>>> df1.groupby(df1.C).apply(remove_duplicates)['B'].reset_index()[['B', 'C']]
       B      C
0    CHC   CCCH
1  CCHCC  CNHCC
2  CNHCC  CNOCH
3           NCH
4           NCH

编程相关推荐

在java中查找特定命名方案的所有文件
java需要帮助在这个程序中查找错误，编译但不是计算机所必需的数字
java Androidsocket连接被拒绝
java在单元测试中使用Intent类
sql server 2008换行转义序列在Java中没有以正确的方式回避
嵌入十六进制编码的unicode Java字符串
java无法为类实现tester程序
为json字符串创建通用java映射器
java如何将2个TextView与Android中的if-else条件放在同一位置
java如何初始化锁？

相关问题更多 >

编程相关推荐

热门问题

热门文章

python pandas如何选择性地删除重复项

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >