将PySpark数据帧中的一行拆分为多行

1条回答

网友

1楼 · 发布于 2024-05-14 14:26:22

下面是一个可重复的例子：

# Create dummy data
df = sc.parallelize([(1, 2, 3, 'a b c'),
                     (4, 5, 6, 'd e f'),
                     (7, 8, 9, 'g h i')]).toDF(['col1', 'col2', 'col3','col4'])


# Explode column
from pyspark.sql.functions import split, explode
df.withColumn('col4',explode(split('col4',' '))).show()
+----+----+----+----+
|col1|col2|col3|col4|
+----+----+----+----+
|   1|   2|   3|   a|
|   1|   2|   3|   b|
|   1|   2|   3|   c|
|   4|   5|   6|   d|
|   4|   5|   6|   e|
|   4|   5|   6|   f|
|   7|   8|   9|   g|
|   7|   8|   9|   h|
|   7|   8|   9|   i|
+----+----+----+----+

编程相关推荐

java如何向xsi:nil元素添加另一个属性？
Java抽象泛型方法，使用具体类型实现通配符
java使用pcap4j截断pcap文件
当我放置字母a、b和c时，java中的异常预期会下降
java设置活动对话框不可取消
接口类型变量上的Java克隆
使用Java或BouncyCastle对CSR（证书签名请求）进行安全解码/读取
java调用SavingsAccount对象上的函数并打印结果
java如何在Android应用程序上显示地图上的兴趣点（POI）并与之交互？
如果在JavaFX中的ResultSet中未找到任何内容，则显示java警报

相关问题更多 >

编程相关推荐

热门问题

热门文章

将PySpark数据帧中的一行拆分为多行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >