如何使用带Dask的regex删除行?

2024-06-11 15:56:30 发布

您现在位置:Python中文网/ 问答频道 /正文

有没有办法在dask数据帧上使用regex条件删除行?我有一个大约有1亿行的dask数据帧,我想在处理它之前删除B列中包含'theocean'的行。有没有办法做到这一点?在

数据帧如下所示:

df = pd.DataFrame({
"A":[34,12,78,84, 96], 
"B":['land', '', 'human', 'seagull by the ocean', 'running fox']
})
patternDel = '^.*THE OCEAN.*$'
filter = df['B'].str.contains(patternDel)
df = df[~filter]

但这对我来说似乎行不通。在

仅供参考:我不能在这里使用pandas,因为数据不适合内存。在


Tags: 数据dataframedfbyfilter条件daskregex