Python中的频繁模式挖掘

2024-05-19 15:38:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道如何在python中获得itemsets的绝对支持和相对支持。目前我有以下几点:

import pandas as  pd
import pyfpgrowth
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
from collections import Counter


dataset = [['a', 'b', 'c', 'd'],
              ['b', 'c', 'e', 'f'],
              ['a', 'd', 'e', 'f'],
              ['a', 'e', 'f'],
              ['b', 'd', 'f']
           ]
te = TransactionEncoder()
te_ary = te.fit(dataset).transform(dataset)
df = pd.DataFrame(te_ary, columns=te.columns_)
print (df)
#print support
print(apriori(df, min_support = 0.0))
#print frequent itemset
frequent_itemsets = apriori(df, min_support=0.6, use_colnames=True)
frequent_itemsets['length'] = frequent_itemsets['itemsets'].apply(lambda x: 
len(x))
frequent_itemsets
print ("frequent itemset at min support = 0.6")
print(frequent_itemsets)

但我不知道如何返回绝对支持和相对支持。在


Tags: fromimportsupportdfmindatasetpdprint
1条回答
网友
1楼 · 发布于 2024-05-19 15:38:46

相对支持是您的frequen_itemsetsDataFrame的一部分。您可以从以下地址获取:

frequent_itemsets['support']

你可以计算出绝对支撑乘以篮子的数量:

^{pr2}$

相关问题 更多 >