如果行值包含列表中的项作为子字符串,请将行值保存到其他数据帧
输入数据帧:
index link
1 https://zeewhois.com/en/
2 https://www.phpfk.de/domain
3 https://www.phpfk.de/de/domain
4 https://laseguridad.online/questions/1040/pued
list=['verizon','zeewhois','idad']
如果df['link']将list
的任何项作为子字符串,我们需要将该特定的link
放在不同的新数据帧中
到目前为止,我已经对link
列进行了预处理,并购买了以下格式:
index link
1 httpszeewhoiscomenwww
2 httpswwwphpfkdedomain
3 httpswwwphpfkdededomain
4 httpslaseguridadonlinequestions1040pued
查找哪些行值包含作为子字符串的list
中的项
df["TRUEFALSE"] = df['link'].apply(lambda x: 1 if any(i in x for i in list) else 0)
但我得到了一个错误:
TypeError: 'in <string>' requires string as left operand, not float
您可以使用str.contains
然后只需过滤True就可以得到新的数据帧
您不需要处理
link
。您可以简单地执行以下操作:相关问题 更多 >
编程相关推荐