我有一个数据帧如下-
a | b | c
[1] | [3,4,5,6] | [7,8,9,10]
我需要输出为
^{pr2}$
目前,我使用以下语句得到如下输出-
cols=['a','b','c']
df.rdd.flatMap(lambda x: itertools.izip_longest(*[x[c] for c in cols])).toDF(cols)
a | b | c
1 3 7
null 4 8
null 5 9
null 6 10
列数不是固定的。如果解是广义的,那将是有帮助的。在
Tags:
在 一种选择是使用
itertools.repeat
来重复长度小于最长数组长度的每个数组。在为了便于说明,假设您使用以下数据帧:
^{pr2}$该准则将产生:
^{3}$请注意,
10
重复了一次,以将第a
列中的数组填充到适当的长度。在相关问题 更多 >
编程相关推荐