有没有办法在dask数据帧上使用regex条件删除行?我有一个大约有1亿行的dask数据帧,我想在处理它之前删除B列中包含'theocean'的行。有没有办法做到这一点?在
数据帧如下所示:
df = pd.DataFrame({
"A":[34,12,78,84, 96],
"B":['land', '', 'human', 'seagull by the ocean', 'running fox']
})
patternDel = '^.*THE OCEAN.*$'
filter = df['B'].str.contains(patternDel)
df = df[~filter]
但这对我来说似乎行不通。在
仅供参考:我不能在这里使用pandas,因为数据不适合内存。在
您可以简单地使用由pandas库提供的dataframe的drop函数,而不是使实现复杂化。 使用方法请参考以下链接。 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop.html
相关问题 更多 >
编程相关推荐