对相关性patten质量的经常使用分析指标有如下这些blog
其中,X^2 跟 lift不是null-invariant的,也就是说当~A~B项较多时,这两个指标不是很可靠。io
据Jiawei Han所言,Kulczynski这个指标是比较稳定而好用的,同时还要辅助观察imbalance ratio来看评价结果的争议程度im
一个具体使用例子为:d3
最后总结一下:总结
咱们进行Patten Mining,主要是为了找到一块儿出现的可能性足够高且争议不大的“组”。img
那么,咱们追求的即是:ant
1. Kulczynski值足够大(接近1)co
2. IR相对小(接近0)d3