我对Spark环境和发展有点陌生。在
我有两个RDD,通过一个joiner合并,结果如下:
(u'10611', ((u'Laura', u'Mcgee'), (u'66821', u'COMPLETE')))
(u'4026', ((u'Mary', u'Smith'), (u'3237', u'COMPLETE')))
(u'4026', ((u'Mary', u'Smith'), (u'4847', u'CLOSED')))
如果您看到我有两个元组和一个键,我想合并两个元组,并将其保留为键和一个元组,如下所示:
^{pr2}$另外,我如何在saveAsTextFile之前格式化它,用制表符分隔。示例
10611 Laura Mcgee 66821 COMPLETE
4026 Mary Smith 3237 COMPLETE
4026 Mary Smith 4847 CLOSED
我有类似的东西,但不知道如何用元组访问它:
.map(lambda x: "%s\t%s\t%s\t%s" %(x[0], x[1], x[2], x[3]))
您也可以使用列表/元组理解来执行此操作,方法如下:
输出:
^{pr2}$然后,要格式化输出,也可以执行以下操作:
输出:
假设你的数据格式一致,你可以用一个简单的加法运算符合并元组。。。
输出到文本应该很简单,但是你奇怪的结构也让它有点奇怪。你的兰达不错,但你也可以:
^{pr2}$我不确定这有多好,但它有效。
相关问题 更多 >
编程相关推荐