规则关联挖掘陷入了不可破解的lis

2024-04-16 16:44:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试做一个免费的在线课程从零开始规则关联挖掘。输入是一个包含多行文本的文件。每一行代表一张收据,收据内的项目用逗号隔开。你知道吗

我的过程是把每一行分开,然后把每一行中的项目分开。但是,我认为我正在创建列表列表,然后无法运行组合。以下是我目前的代码:

item_counts = defaultdict(int)
from itertools import combinations

basket_rules = {}
lines = groceries_file.split("\n")

items = []
for a in lines:
    items.append(a.split(","))

itemset = set(c for c in items)

pair_counts = defaultdict(int)
item_counts = defaultdict(int)

for a, b in combinations(itemset, 2):
    pair_counts[(a,b)] += 1
    pair_counts[(b,a)] += 1

最后一个for循环的错误是 TypeError:无法处理的类型:“list”

我肯定我在这里遗漏了什么。请让我知道你的想法。你知道吗


Tags: 项目in列表foritemsitemintsplit