【数据挖掘】FPgrowth算法笔记

1. 提出问题 对于Apriror算法来讲,仍然受到两种非平凡开销的影响:web 仍然须要产生大量的候选集。例如,若是有10^4个频繁1项集,则须要产生10^7个候选频繁2项集。算法 可能须要重复地扫描整个数据库。检索数据库中每一个事务来肯定候选项集支持度的开销会很大。数据库 因此,咱们须要设计一种方法,挖掘所有频繁项集而无须这种代价昂贵的候选产生过程。即,不须要产生如此大量的候选集,同时在肯定候
相关文章
相关标签/搜索