Spark Mllib之频繁模式挖掘--基于RDD

微信公众号:数据挖掘与分析学习java 挖掘频繁项,项集,子序列或其余子结构一般是分析大规模数据集的第一步,这是数据挖掘多年来一直活跃的研究课题。spark.mllib提供了FP-growth的并行实现,这是一种挖掘频繁项集的流行算法。算法 1.FP-growth  Han et al., Mining frequent patterns without candidate generation这
相关文章
相关标签/搜索