FP-growth算法发现频繁项集(一)——构建FP树

  常见的挖掘频繁项集算法有两类,一类是Apriori算法,另外一类是FP-growth。Apriori经过不断的构造候选集、筛选候选集挖掘出频繁项集,须要屡次扫描原始数据,当原始数据较大时,磁盘I/O次数太多,效率比较低下。FPGrowth不一样于Apriori的“试探”策略,算法只需扫描原始数据两遍,经过FP-tree数据结构对原始数据进行压缩,效率较高。html   FP表明频繁模式(Fre
相关文章
相关标签/搜索