指定值和前面值的子集df

import pandas as pd df = pd.DataFrame({ 'Val' : [1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4], 'ID' : ['X','Y','B','X','C','X','C','D','E','Y','Y','A','B','C','X','C','Y','D','E','A'], }) items = ['B','D'] other_items = ['X','Y'] df = df.loc[(df['ID'].isin(items)) | df['ID'].shift(-1).isin(items) & (df['ID'].isin(other_items))]

1条回答

网友

1楼 · 发布于 2024-04-25 21:02:29

首先按两个列表的总和仅筛选行，然后按上一个和下一个值筛选：

items = ['B','D']
other_items = ['X','Y']

df = df[df['ID'].isin(other_items + items)]

m1 = df['ID'].isin(other_items) & df['ID'].shift(-1).isin(items)
m2 = df['ID'].isin(items) & df['ID'].shift().isin(other_items)

如果需要按组处理：

m1 = df['ID'].isin(other_items) & df.groupby('Val')['ID'].shift(-1).isin(items)
m2 = df['ID'].isin(items) & df.groupby('Val')['ID'].shift().isin(other_items)

最后一个过滤器：

df = df[m1 | m2]
print (df)
    Val ID
1     1  Y
2     1  B
5     2  X
7     2  D
10    3  Y
12    3  B
16    4  Y
17    4  D

相关问题更多 >

编程相关推荐

热门问题

热门文章

指定值和前面值的子集df

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >