我有一个表(Please Ref Image),在这个表中,我想从每一行中删除“A”字符,我可以在Python中做什么。在
下面是我使用regexe_replace
的代码,但是代码没有优化我想要优化的代码
def re(s):
return regexp_replace(s, "A", "").cast("Integer")
finalDF = finalD.select(re(col("C0")).alias("C0"),col("C1"),
re(col("C2")).alias("C2"),
re(col("C3")).alias("C3"),col("C4"),
re(col("C5")).alias("C5"),
re(col("C6")).alias("C6"),col("C7"),
re(col("C8")).alias("C8"),
re(col("C9")).alias("C9"),col("C10"),
re(col("C11")).alias("C11"),col("C12"),
re(col("C13")).alias("C13"),
re(col("C14")).alias("C14"),col("C15"),
re(col("C16")).alias("16"),col("C17"),
re(col("C18")).alias("18"),
re(col("C19")).alias("C19"),col("Label"))
finalDF.show(2)
提前谢谢你。在
为什么是regex?正则表达式将是过度杀戮。在
如果您有给定格式的数据,请使用替换函数,如下所示:
内容主.csv:
代码:
^{pr2}$输出:
一次性从完整数据中替换“A”进行编码(无需逐行)
输出:
相关问题 更多 >
编程相关推荐