我现在有一个数据框,其中一列是“a b c d e…”类型的。将此列称为“col4”
我想通过拆分col4的元素将一行拆分为多行,保留所有其他列的值。
例如,给定一个具有单行的df:
col1[0] | col2[0] | col3[0] | a b c |
我希望输出为:
col1[0] | col2[0] | col3[0] | a |
col1[0] | col2[0] | col3[0] | b |
col1[0] | col2[0] | col3[0] | c |
使用split和explode函数,我尝试了以下操作:
d = COMBINED_DF.select(col1, col2, col3, explode(split(my_fun(col4), " ")))
但是,这会导致以下输出:
col1[0] | col2[0] | col3[0] | a b c |
col1[0] | col2[0] | col3[0] | a b c |
col1[0] | col2[0] | col3[0] | a b c |
这不是我想要的。
下面是一个可重复的例子:
相关问题 更多 >
编程相关推荐