Spark MLlib FPGrowth关联规则算法

一.简介   FPGrowth算法是关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-tree),但仍保留项集关联信息。在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。   相关术语:     1.项与项集       这是一个集合的概念,以购物车为例,一件商品
相关文章
相关标签/搜索