支持度计算过程 html
能够看到,最终能够获得3层支持度:L1,L2,L3,接下来,咱们能够直接经过支持度计算各层的置信度,这里咱们以L3为例:
算法
置信度计算比较简单,就是根据K层集合中K-1个元素到另一个元素的置信度,直接套用上边公式便可。这里咱们其实能够得出规则,当BC或CE出现的时候,E或B必然出现。固然,这里只是个简单的例子,实际中必需要有足够的样本,结果才更可靠。
数据库
从上边看Apriori算法基本原理仍是比较简单的,可是实际过程当中若是按照这样来计算,对于N个商品会有2^N−1个组合,但N稍大点计算量就很是大了,因此实际算法实现中,要利用开头提到Apriori算法的性质进行剪枝,以减小计算量。此外,关联规则算法还有FP-Growth和Eclat等更为高效的算法,这里再也不介绍,可自行了解。
参考: Apriori算法详解、使用Apriori算法和FP-growth算法进行关联分析 安全