今日头条核心技术“个性推荐算法”揭秘

今日头条核心技术“个性推荐算法”揭秘

最近面试华兴资本, 他们比较关注今日头条算法的实现, 今天特转载网上 今日头条算法解密

  【IT168 评论】互联网给用户带来了大量的信息,知足了用户在信息时代对信息的需求,也使得用户在面对大量信息时没法从中得到对本身真正有用的那部分信息,对信息的使用效率反而下降了,而一般解决   1月20日,新生代移动互联网企业今日头条在北京国家会议中心举办了“算数·年度数据发布会”,数据发布会的主题名为“算数”,实际上指的是“算法”与“数据”。html

  众所周知,今日头条是 面试

  那么今日头条是怎么作到为每个用户按兴趣精准推荐新闻的呢?在发布会上,今日头条的技术副总裁杨震原给咱们揭秘了今日头条的个性化推荐核心“算法”。算法

  今日头条的个性化推荐算法原理spa

  如上图,有3篇文章,让3个用户投票(注:这3个用户是一类人,有相同属性(喜爱和偏好)),那第4个用户应该被系统推荐的文章是那篇呢?第4个用户与前3个用户都是一类人,答案显   没错,今日头条的个性化推荐算法原理   今日头条是如何来划分人群和文章3d

  搞技术的朋友都知道,   上面那个例子只是很小的人群,可是现实生活中不会有这样小的人群,并且过小的人群经过推荐投票的方式也很难推荐出很精细的内容,只能推荐出一些热门内容,那今日头条是如何来划分人群?htm

  咱们假定上图这   根据人群不一样维度,咱们能够细分到一个合理的力度。特别须要注意的是:在细分的领域里面投票数既不要太多,但也不要太少,由于太多没有个性化,仅是一个大众关心的话题而已,而投票数太少又没有统计意义,支持度就低了。blog

  人群特征能够是阅读姓名,年龄,地域,职业等等。同理,文章也是相似的,文章有提到哪些名人,文章发布的时间,文章所属的地区等等,也都有不少特性,这些都是能够去组合起来。排序

  今日头条是怎样判断一我的属于怎样的人群get

  判断一我的属于怎样的人群相对简单。好比地域,用户的手机在什么区域,就能够认为用户是什么地域的;好比说用户兴趣,能够根据用户的阅读习惯去判断,用户会常常去看科技的文章,那就能够判断用户属于科技的人群;再好比说用户的好友关系,用户在今日头条上面注册了,用户的好友都是娱乐圈的人,则该用户颇有可能也是娱乐圈的人;因此经过用户在今日头条上行为,以及用户客观的地理位置信息,就能判断用户到底属于一个什么样的人群。数据分析

  今日头条的个性推荐算法公式

  精准推荐最难的不是划分人群,也不是判断用户人群归属,更不是文章属性判断,一我的能够属于多我的群,也有多个文章候选,选那个推荐才是最难的。而今日头条的推荐内容是怎么算出来的呢?

  经过上图的计算公式:W1*候选1的投票率+W2*候选2的投票率+W3候选3的投票率+……=最高分,最后能计算出一个得分,按得分的高低来排序,就能够获得推荐文章的一个侯选,这个过程其实是一个比较简单的算法,而这在今日头条内部叫逻辑回归。

  总的来讲,个性化推荐技术自己并不神秘,归根到底推荐算法关键是还在于对海量用户行为的数据分析与挖掘,也许各家算法略有不一样,但最终目的都是异曲同工,为实现最精准的内容推荐而努力中。

  若是你看的还不过瘾,欲知更多(阿里、腾讯、网易、58同城、豆瓣等)知名站点推荐系统技术内容,请点击(牛逼站是怎样炼成的?-推荐系统篇

相关文章
相关标签/搜索