FP-growth算法发现频繁项集（一）——构建FP树

时间 2020-05-08

标签 growth 算法发现频繁构建繁體版

原文原文链接

　　常见的挖掘频繁项集算法有两类，一类是Apriori算法，另外一类是FP-growth。Apriori经过不断的构造候选集、筛选候选集挖掘出频繁项集，须要屡次扫描原始数据，当原始数据较大时，磁盘I/O次数太多，效率比较低下。FPGrowth不一样于Apriori的“试探”策略，算法只需扫描原始数据两遍，经过FP-tree数据结构对原始数据进行压缩，效率较高。html 　　FP表明频繁模式（Fre

>>阅读原文<<