如果任何列包含关键字之一，则删除行

keywords=['Nokia' , 'Asus'] data = [['Nokia', 'AB123','broken'], ['iPhone', 'DF747','battery'], ['Acer', 'KH298','exchanged for a nokia'], ['Blackberry', 'jj091','exchanged for a Asus']] df = pd.DataFrame(data, columns = ['Brand', 'ID', 'Description'])

Brand | ID | Description ---------------------------------------- Nokia | AB123 | broken iPhone | DF747 | battery Acer | KH298 | exchanged for a nokia Blackberry | jj091 | exchanged for a Asus

2条回答

网友

1楼 · 编辑于 2024-05-13 19:33:08

df = df[~(df.stack().str.contains('|'.join(keywords)).any(level=0))]

或者

df = df[~(df.astype(str).sum(axis=1).str.contains('|'.join(keywords)))]

输出

     Brand  ID      Description
1   iPhone  DF747   battery
2   Acer    KH298   exchanged for a nokia

网友

2楼 · 编辑于 2024-05-13 19:33:08

您可以使用+或apply将所有列连接在一起，然后使用|为regex OR创建具有连接值的^{}掩码：

df = df[~(df['Brand']+df['ID']+df['Description']).str.contains('|'.join(keywords))]

或：

df = df[~df.apply(' '.join, 1).str.contains('|'.join(keywords))]
print (df)
    Brand     ID            Description
1  iPhone  DF747                battery
2    Acer  KH298  exchanged for a nokia

如果需要不区分大小写的addcase参数：

df = df[~df.apply(' '.join, 1).str.contains('|'.join(keywords), case=False)]
print (df)
    Brand     ID Description
1  iPhone  DF747     battery

相关问题更多 >

编程相关推荐

热门问题

热门文章