我想生成以下项目集的关联规则。:
df1
Age,AL,SEX,DIAB,SMOK,CHOL,LAD,RCA,LM
65,0,M,n,y,220,80,75,20
45,0.2,F,n,n,300,90,35,35
66,-1,F,y,y,200,90,80,20
70,0.2,F,n,y,220,40,85,15
80,1.1,M,y,y,200,90,90,25
但是首先,我想将项目集分成两组,并从这两组中创建关联规则。 例如 第一组:
(Age, Sex, SMOKE, DIAB)
第二组:
(AL, CHOL, LAD, RCA, LM)
这种情况是为了防止一组中的两个项目发生关联,而不是与另一组产生关联。
我用来从所有项集生成关联规则的代码是
records = []
for i in range(0, len(df1)):
records.append([str(df1.values[i,j]) for j in range(0, len(df1.columns))])
te = TransactionEncoder()
te_ary = te.fit(records).transform(records)
df = pd.DataFrame(te_ary, columns=te.columns_,)
frequent_itemsets = apriori(df, min_support=0.01, use_colnames= True)
rules = association_rules(frequent_itemsets, metric= "confidence", min_threshold = 0.7 )
如何使用apriori对分组项集执行相同的操作?
目前没有回答
相关问题 更多 >
编程相关推荐