我正在处理pyspark数据帧,我有一列words
{
+---+----------------------------------------------+
|id | words |
+---+----------------------------------------------+
|564|[fhbgtrj5, 345gjhg, ghth578ghu, 5897, fhrfu44]|
+---+----------------------------------------------+
预期产出:
+---+----------------------------------------------+
|id |words |
+---+----------------------------------------------+
|564| [fhbgtrj, gjhg, ghthghu, fhrfu]|
+---+----------------------------------------------+
请帮忙
您可以使用
transform
和regexp_replace
删除数字,并使用array_remove
删除空条目(来自仅由数字组成的条目)相关问题 更多 >
编程相关推荐