从Pyspark列中获取值，并将其与Python字典进行比较

1条回答

网友

1楼 · 发布于 2024-05-13 08:14:09

您可以尝试以下方法（通过添加空处理从this answer改编）：

from itertools import chain
from pyspark.sql.functions import create_map, lit, when

object_map = {'rd.123': 'rd.567'}
mapping_expr = create_map([lit(x) for x in chain(*object_map.items())])

df1 = df.filter(df['Section_1'].isNull()).withColumn('Section_2', F.lit(None))

df2 = df.filter(df['Section_1'].isNotNull()).withColumn(
    'Section_2', 
    when(
        df['Section_1'].isNotNull(), 
        mapping_expr[df['Section_1']]
    )
)

result = df1.unionAll(df2)

编程相关推荐

java使用并发hashmap减少线程池的内存使用？
java为什么在提交片段后出现错误“getParentActivityIntent:badActivity name”？
vim UltiSnips扩展java包
java给出了一个名称列表，如何插入、删除、显示、搜索和退出？Java程序
java Spring集成：只从FTP服务器下载新的或更新的文件？
使用Java中的Scala：将函数作为参数传递
java线程1每秒填充一个映射，线程2每60秒保存一个条目
java从私有类访问公共类中的方法/字段
如何使用ApacheSpark流媒体和JavaAPI从所有人那里获取英语推文？
java是否可以在父标记和子标记中编写XMLSchemainstance？

相关问题更多 >

编程相关推荐

热门问题

热门文章

从Pyspark列中获取值，并将其与Python字典进行比较

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >