ECLAT(Equivalence Class Transformation):通常的数据库是根据项ID和项值来存储的,这里的主要思想是把惟一的项值提出来,对应列放在数据库中的项ID列表。
此时,当前项的频率就是ID列表的大小,若是要看两个项的频率就是求IDlist的交集。 这种存储具有以下的特征:若是idlist如出一辙,表明这两项确定是一块儿出现;若是x的ID列表是Y的ID列表的子集,那么拥有X项的记录一定拥有Y
hash较少表明集数量
对全部k集频繁项作hash计算,hash表中存储计算结果为同一个hash值的个数【能够在具体的分区作】,若是这个数值小于support值,那么当前hash桶中的全部项都不是频繁的,就不会当作表明集频繁模式挖掘-DHP算法详解 | I am Busyui