关联规则、支持度(support)、置信度(confidence)、并运用Spark RDD计算

转载请标明出处:小帆的帆的专栏html 例子: 总共有10000个消费者购买了商品, 其中购买尿布的有1000人, 购买啤酒的有2000人, 购买面包的有500人, 同时购买尿布和啤酒的有800人, 同时购买尿布的面包的有100人。web 关联规则 关联规则:用于表示数据内隐含的关联性,例如:购买尿布的人每每会购买啤酒。算法 支持度(support) 支持度:{X, Y}同时出现的几率,例如:{尿
相关文章
相关标签/搜索