Python2.7:从集合列表创建字典

from pyspark.mllib.fpm import FPGrowth FreqItemset(items=[u'A_String_0'], freq=303) FreqItemset(items=[u'A_String_0', u'Another_String_1'], freq=302) FreqItemset(items=[u'B_String_1', u'A_String_0', u'A_OtherString_1'], freq=301)

1条回答

网友

1楼 · 发布于 2024-05-28 23:30:15

如果你想要一个RDD，就不要收集freqItemsets
```
model = FPGrowth.train(transactions, minSupport=0.2, numPartitions=10)
freqItemsets = model.freqItemsets()
```
你当然可以parallelize
结果=model.freqItemsets模型（）.收集（） sc.并行化（结果）
我不知道你为什么需要这个（它看起来像一个XY problem 但你可以对收集到的数据进行理解：
```
{tuple(x.items): x.freq for x in result}
```
或者
```
{",".join(x.items): x.freq for x in result}
```

一般来说，如果要对数据应用进一步的转换，请不要直接在Spark中收集和处理数据。你知道吗

您还应该看看scalaapi。它已经实现了association rules。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python2.7:从集合列表创建字典

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >