如何从spark DF中的列中选择Dev\”
和dev\
后面的字符或文件路径
pyspark列的样本行:
\\D\Dev\johnny\Desktop\TEST
\\D\Dev\matt\Desktop\TEST\NEW
\\D\Dev\matt\Desktop\TEST\OLD\TEST
\\E\dev\peter\Desktop\RUN\SUBFOLDER\New
预期产出
johnny\Desktop\TEST
matt\Desktop\TEST\NEW
matt\Desktop\TEST\OLD\TEST
peter\Desktop\RUN\SUBFOLDER\New
我尝试使用下面的代码
df = df.withColumn(
"sub_path",
F.element_at(F.split(F.col("path"), "Dev\\\\"), -1)
)
它只是给出了我想要的正确结果。 感谢有人能帮忙
以下修改
[Dd]
同时匹配大写和小写d
让我知道这是否适合你
相关问题 更多 >
编程相关推荐