变量origin
的类型是pyspark.rdd.PipelinedRDD
,origin
包含如下内容:
[u'masquerade',
u'squaremade',
u'dianas',
u'naiads',
u'antagonist',
u'stagnation',
u'bates',
u'beast',
u'beats',
u'thanks']
我要键和所有按键排序的变音图:
^{2}$
我知道它可能需要map
或reducebykey
函数,但我真的不知道怎么做。在
Tags:
首先需要定义RDD:
您可以打印它以查看结果:
^{pr2}$现在将其转换为键值对:
减少:
您可以打印结果:
如果还需要对键进行排序,并且驱动程序中有足够的空间存储所有数据,则可以对结果进行排序:
相关问题 更多 >
编程相关推荐