Jaccard系数

   Jaccard 系数,又叫做Jaccard相似性系数,用来比较样本集中的相似性。Jaccard系数等于样本集交集与样本集合集的比值。

   公式:

        
    

 用来比较两个集合A和B的相似度。它可以用来比较文档相似度,示例:

 

 
 

 

英文资料:http://en.wikipedia.org/wiki/Jaccard_index