from pyspark.ml.fpm import FPGrowth
# create empty list buffer_list
buffer_list = []
for x in range(101):
buffer_list.append((x,prosecced_text[x]))
df = spark.createDataFrame(buffer_list, ["id", "items"])
fpGrowth = FPGrowth(itemsCol="items", minSupport=0.5, minConfidence=0.6)
model = fpGrowth.fit(df)
您可以以+id增量使用for的组合
一般来说,我建议使用列表理解来创建类似您需要的列表的内容,但是您需要的特定元组列表正是^{} 生成的内容(但是我们必须通过显式地从中构造
list
来使用enumerate
的输出,以便获得实际的列表):enumerate
所做的是返回一个迭代器,该迭代器生成(index,value)
元组,其中index
默认从0
开始,value
是传递给enumerate
的iterable的每个对应元素。你知道吗根据@pault现在删除的注释,特定方法^{} 接受任何类型的iterable作为其第一个参数,因此在上述特定情况下甚至不需要对
list
的封闭调用。如果您直接传递enumerate(prosecced_text)
,它就可以工作了。你知道吗相关问题 更多 >
编程相关推荐