我有一种情况,即我的rdd键在每个字典中不同,有些有更多和不同的键比其他人。你知道吗
因此,我无法使用toDF()
直接转换它们。有人有更好的主意吗?你知道吗
list1 = [{'this':'bah', 'is': 'bah'},
{'this': 'true', 'is': 'false'},
{'this': 'true', 'is': 'false', 'testing':'bah'}]
rdd = sc.parallelize(list1)
rdd.map(lambda x: Row(**x)).toDF().show()
我想没有现成的解决办法。你知道吗
乍一看,我要做的是创建一个包含集合中所有列的
set()
列表,然后遍历每一行以创建所有不存在的列,并将它们初始化为None
:然后您的集合具有相同的列数:
相关问题 更多 >
编程相关推荐