擅长:python、mysql、java
<p><strong>那你就不是在做先验的</strong>。在</p>
<p>在Apriori中,除了k=1之外,您从不枚举k大小的所有子集。在</p>
<p>在任何更大的尺寸中,您都可以根据<code>Apriori-Gen</code>构造组合。在</p>
<p>这样效率更高,实际上至少和手动构建所有组合一样简单。在</p>
<p>这里有一个例子。假设发现以下项集频繁出现:</p>
<pre><code> ABCD
ABCF
ABEF
ABDF
ACDF
BCDF
</code></pre>
<p>那么apriori将只构造一个候选(根据前缀规则!)公司名称:</p>
^{pr2}$
<p>然后它将检查其他子集是否也被发现是频繁的,即</p>
<pre><code> BCDF
ACDF
ABDF
</code></pre>
<p>因为所有这些都在上一轮中,所以这个候选者存活下来,并将在下一次对数据集的线性扫描中进行测试。在</p>
<p>Apriori是关于<em>而不是</em>必须检查k大小的所有子集,而只是那些有机会频繁的子集,前提是已知<em>以前的知识</em>。在</p>