2024-05-12 19:32:59 发布
网友
下面是我的RDD,有5个字段
[('sachin', 200, 10,4,True), ('Raju', 400, 40,4,True), ('Mike', 100, 50,4,False) ]
这里我只需要获取第1、第3和第5字段,如何在PySpark中实现。预期结果如下。我试过用几种方法来还原,但都没成功
用一张简单的地图?在
rdd.map(lambda x: (x[0], x[2], x[4]))
用一张简单的地图?在
相关问题 更多 >
编程相关推荐