我尝试使用这种方法进行数据帧过滤
reduced_df = full_df[(full_df['field1'] == some_defined_value1) & \
(full_df['field2'] == some_defined_value2) & \
(full_df['field3'].apply(lambda x: x for x in ','.join(list_of_comma_separated_string))) & \
(full_df['field4'].apply(lambda x: x for x in ','.join(list_of_comma_separated_string)))]
我被卡在了。应用部分。如果field3值在字符串列表中,那么我要做的是将该行引入。例如:
如果与
field3 = 'apples,oranges,bananas' # please note it is a single string
我有一个
list_of_comma_separated_string = ['apples', 'oranges', 'bananas', 'grapes', 'peaches']
然后,该行应包含在缩减的_df中。然而如果
field3 = 'melons,avacado,mint'
则该行不应包含在缩减的_df中
我尝试了几种方法(这是我最新的尝试),但似乎都不管用。这是一个返回错误: 生成器对象不可调用
多谢各位
split
和explode
(需要0.25)字符串,然后检查any
单词isin
列表l
(不需要长名称)样本:
然后,您可以将您的条件写为:
相关问题 更多 >
编程相关推荐