【频繁项集挖掘】FP-growth算法原理

FP-growth,FP表示frequent pattern。它通过在内存中构建FP-tree,减少了描述数据库的次数,减少了候选频繁项集的个数。FP-tree主要通过前缀共享的树结构方式,寻找频繁项。FP-tree其实是一棵前缀树,按支持度降序排列,支持度越高的频繁项离根节点越近,从而使得更多的频繁项可以共享前缀。   1. 问题定义 图1 购物篮数据的二元表示   图1表示顾客的购物篮数据,其
相关文章
相关标签/搜索