1、推荐系统概念算法
一、推荐系统定义api
维基百科:推荐系统属于资讯过滤的一种应用。推荐系统可以将可能受喜爱的资讯或实物(例如:电影、电视节目、音乐、书籍、新闻、图片、网页)推荐给使用者。分布式
推荐系统大致可分为两类,即个性化推荐和非个性化推荐。oop
二、推荐系统做用性能
从用户角度:大数据
从网站角度:网站
好的推荐系统更像一个有经验的网站导购员搜索引擎
三、推荐系统与其余系统的区别设计
推荐与搜索排序
相同点:帮助用户找到商品
不一样点:搜索是经过用户主动输入的关键字进行查询。推荐则是用户在浏览网站的过程当中,不必定须要用户输入,根据当前网页的上下文进行个性化的信息输出。
推荐与广告
相同点:基于用户行为
不一样点:广告目的是帮助商家推广商品等,推荐系统帮助用户找到想要的商品等。
推荐与SNS
相同点:它们都有基于人群的共同点产生推荐
不一样点:一个是机器,一个是人工
四、推荐系统的主要产品
2、推荐系统的组成
一、数据
二、算法
算法须要配合大量业务规则,没有最好,只有更好!
三、消息系统
消息系统是大型系统不可或缺的重要组成部分,与其余系统解耦,消息转发。
四、搜索引擎
主要功能是进行文本分析抽取关键词,做为推荐系统的一个信息检索技术内容相关性匹配。
五、NoSQL
简单、高性能、方便定制
六、分布式计算
使用MapReduce , Hive、Hadoop进行大规模数据统计和运算和大数据集合的ETL
3、淘宝的推荐系统
一、淘宝数据特色
二、淘宝推荐系统应用场景
目前覆盖大小场景60多个,主要包括
淘宝业务产品丰富,推荐功能穿插其中,推荐功能涵盖的范围更广,不少场景推荐算法与业务规则相关。
三、淘宝推荐系统算法
①基础算法:聚类算法,预测算法,分类算法等,主要用于产生基础知识库
②推荐算法:content-based,collaborative-based,Association Rules等等
基于内容推荐:经过给用户和商品标注Tag,经过内容匹配算法,推荐商品给用户
协同思想
关联规则:类目的相关性、商品相关性、人的相关性
四、推荐系统的效果评测
五、淘宝推荐系统的设计
① 分布是存储:Treasure
②调度系统
③协调系统
总结:推荐系统是须要不断创新而且与场景和行业有事紧密的关系