我有一个如下的数据框
name genre
satya |ACTION|DRAMA|IC|
satya |COMEDY|BIOPIC|SOCIAL|
abc |CLASSICAL|
xyz |ROMANCE|ACTION|DARMA|
def |DISCOVERY|SPORT|COMEDY|IC|
ghj |IC|
现在我想查询数据帧,这样就可以得到第1、5和6行,即:我想找到单独使用或与其他类型的任何组合使用的| IC |。
到目前为止,我可以使用
df[df['genre'] == '|ACTION|DRAMA|IC|'] ######exact value yields row 1
或字符串包含
df[df['genre'].str.contains('IC')] ####yields row 1,2,3,5,6
# as BIOPIC has IC in that same for CLASSICAL also
但我不想要这两个。
#df[df['genre'].str.contains('|IC|')] #### row 6
# This also not satisfying my need as i am missing rows 1 and 5
因此,我的要求是找到包含| IC |的类型(我的字符串搜索失败,因为python将|视为or运算符)
有人建议一些注册或任何方法来做到这一点
可能是这种结构:
我认为您可以将} :
\
添加到regex中以进行转义,因为|
而不使用\
被解释为^{相关问题 更多 >
编程相关推荐