我非常熟悉apriori算法,以及support/confidence/lift的含义。在
我目前使用的是apyoriapriori实现,我不确定我是否理解apyori.apriori()
调用的输出。在
结果是这样的
> RelationRecord(items=frozenset({'item1', 'item2'}),
> support=0.15365410803449842,
> ordered_statistics=[OrderedStatistic(items_base=frozenset({'item1'}),
> items_add=frozenset({'item2'}), confidence=0.6203420891875382,
> lift=2.2233410344037092),
> OrderedStatistic(items_base=frozenset({'item2'}),
> items_add=frozenset({'item1'}), confidence=0.5507049891540131,
> lift=2.2233410344037097)])
规则是什么?有多个支持/信心/提升,每一个代表什么?在
如果能对输出的每一部分进行字典式的解释,我将不胜感激
RelationRecord反映了项的子集,而ordered\u statistics是OrderedStatistics的列表,它反映了规则。每个OrderedStatistics的items_base是前因,items_add是后因。支持存储在RelationRecord中,因为它与包含的规则相同。在
在您的例子中:
第1项->;第2项,置信度为0.62,升力为2.2233410344037092x
第2项->;第1项,置信度为0.55,升力为2.2233410344037097x
两者的支持度均为0.15365410803449842。在
不管怎样,我最后转而使用PyFIM来实现相对的特性丰富性和其他捆绑算法(例如fp growth)。在
相关问题 更多 >
编程相关推荐