Python正在寻找不连续的重复项

2024-04-19 04:35:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我在寻找熊猫数据帧中非连续的重复字符串。 注意:我使用了Shift,但无法获得所需的输出。你知道吗

Abc
aa级 aa级 aa级 aa级 bb型 bb型 bb型 aa级 bb型 复写的副本 复写的副本 bb型 复写的副本 抄送

期望输出: aa级 bb型 bb型 抄送


Tags: 数据字符串shift副本aaabcbb
2条回答

假设您的预期输出不正确。。。你知道吗

df[df['ABC'].shift(-1) != df['ABC']]

    ABC
3   aa
6   bb
7   aa
8   bb
10  cc
11  bb
13  cc

好吧,这是我为这个做的代码。你知道吗

a = df[df['ABC'].shift(1) != df['ABC']]
b= df.drop_dupicates('ABC')
c = a[~a.isin(b)]

输出:aa bb cc

相关问题 更多 >