weka实战004:fp-growth关联规则算法

apriori算法的计算量太大,若是数据集略大一些,会比较慢,很是容易内存溢出。算法 咱们能够算一下复杂度:假设样本数有N个,样本属性为M个,每一个样本属性平均有K个nominal值。数据库 1. 计算一项频繁集的时间复杂度是O(N*M*K)。分布式 2. 假设具备最小支持度的频繁项是q个,根据它们则依次生成一项频繁集,二项频繁集,....,r项频繁集合,它们的元素数量分别是:c(q, 1), c
相关文章
相关标签/搜索