Apriori算法分析以及FP-tree算法

提升Apriori算法的有效性 主要的挑战: 1. 要对数据进行屡次扫描 2. 会产生大量的候选集 3. 对候选项集的支持度计算会很是繁琐 解决思路 1. 减小对数据的扫描 2. 缩小产生的候选项集 3. 改进对候选项集的支持度的计算方法 方法1:基于hash表的项集计数 将每一个项集经过相应的hash函数映射到hash表中的不一样的桶中,这样能够将桶中的项集计数跟最小支持度计数相比较,先淘汰一部
相关文章
相关标签/搜索