Pattern Evaluation

对相关性patten质量的经常使用分析指标有如下这些blog

其中,X^2 跟 lift不是null-invariant的,也就是说当~A~B项较多时,这两个指标不是很可靠。io

据Jiawei Han所言,Kulczynski这个指标是比较稳定而好用的,同时还要辅助观察imbalance ratio来看评价结果的争议程度im

一个具体使用例子为:d3

最后总结一下:总结

咱们进行Patten Mining,主要是为了找到一块儿出现的可能性足够高且争议不大的“组”。img

那么,咱们追求的即是:ant

1. Kulczynski值足够大(接近1)co

2. IR相对小(接近0)d3

相关文章
相关标签/搜索