当列文本包含超过10个字时筛选pyspark数据帧

2024-04-25 10:26:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个pyspark.sql.dataframe.DataFrame,我想保留(过滤)我的一列(称为text)有超过10个单词的所有行

我试过了 df = df.filter(len(df.text.split())>10)但这会引发一个异常

我该怎么做才对呢? 非常感谢


Tags: textdataframedfsqllenfilter单词pyspark