机器学习(二十三)——常见算法(关联、相似、TF-IDF等)

1) Apriori算法: 通过apriori算法来实现频繁项集的查询: 支持度:数据集中包含该项集记录所占的比例,上例中{豆奶}的支持度=2/5,{啤酒,尿布}的支持度=3/5。 置信度:针对像频繁集数量>=2的情况,例如{啤酒,尿布},那么置信度=支持度({尿布,啤酒})/支持度(尿布)。 置信度的顺序对结果存在影响:          两个公式的结果未必一致。 需要注意的是,b和a的位置不同
相关文章
相关标签/搜索