2024-04-28 22:16:41 发布
网友
我的日期时间字段格式为:2016-10-15 00:00:00 在将数据保存到parquet文件时使用了推断模式之后,我有一些行不符合这种格式。在
如何在PySpark中集体删除它们?在
它给我的UDF带来了麻烦
假设您正在分析日期列,并且具有无效日期的行为null,通常是这样:
df.filter(col('date').isNotNull())
或者,如果将日期读取为字符串,则可以使用unix_timestamp对其进行解析:
unix_timestamp
假设您正在分析日期列,并且具有无效日期的行为null,通常是这样:
或者,如果将日期读取为字符串,则可以使用
^{pr2}$unix_timestamp
对其进行解析:相关问题 更多 >
编程相关推荐