SparrowRecsys | 如何搭建一个超有成就感的推荐系统?

转眼就开工了,7 天的假期,刷刷抖音,说走就走了。前端

 

说到抖音,就不得不提它的推荐系统,太 NB 了。刷了啥,马上记住你的偏好,推荐类似内容,一不当心 2 小时就过去了,让人欲罢不能,要么日活 6 亿呢。数据库

 

其实“推荐系统”从没像如今这样,影响着咱们的生活。除了抖音、快手这类短视频,还有网购时,天猫、京东会为你推荐商品;想看看资讯,头条、知乎会为你准备感兴趣的新闻等等。缓存

 

而驱动这些巨头进行推荐服务的,都是基于深度学习的推荐模型。服务器

 

想起 2019 年阿里的千人千面系统,促成了天猫“双 11” 2684 亿成交额。假设经过改进商品推荐功能,使平台总体的转化率提高 1%,就能在 2684 亿成交额的基础上,再增长 26.84 亿。这就是推荐工程师的最牛的地方,也是为啥人能拿百万年薪的缘由。微信

 

但在一个成熟的推荐系统上,找到提高的突破点并不容易——不能知足于协同过滤、矩阵分解这类传统方法,而要创建起完整的“深度学习推荐系统”知识体系,加深对深度学习模型的理解,以及大数据平台的熟悉程度,才能实现总体效果上的优化。架构

 

因此春节假期除了刷抖音,我又从新看了看《深度学习推荐系统》这个专栏,2 刷有很多新的启发。做者王喆,Roku 推荐系统架构负责人,也是咱圈里的大佬,一直深耕在推荐系统、计算广告领域,经验很是丰富。他以前出过同名的书,豆瓣评分 9.3,至关高。app

 

当年我看书的时候,就感受实践太少,偏模型原理。因此在据说王喆开了个实践专栏时,第一时间就订阅了,跟着学下来,受益不浅。让我完整地把推荐系统的原理捋了一遍。下面王喆总结的「核心知识图谱」,建议收藏。框架


最重要的是,实操性特别强。王喆特意为了这个专栏,开发了一个开源项目「 SparrowRecsys」,能让你亲手尝试,搭建一套完整的深度学习推荐系统(下面有详细介绍,贼有意思)。能够说是书的实践版本,里面加入了更多技术细节的实现和讨论。机器学习

 

绝不夸张的说,这个专栏让我对深度学习推荐系统的认知,提高到了一个新高度,因此很想把它推荐给你。最近这个专栏要涨价到 ¥129 了,如今到手仅 ¥69 ,必定别错过了,扫码免费试读👇ide

 

秒杀+口令「shendu666

到手仅 ¥69 ,即将涨至 ¥129

 

 

王喆这课,为啥值得买?

 

先来讲说这个 SparrowRecsys 推荐系统。王喆把它叫作“麻雀推荐系统”,取“麻雀虽小、五脏俱全”之意,它利用了开源的 movielens 数据集,搭建起了包括:

Spark、Flink 特征工程

TensorFlow 深度学习模型训练

TensorFlow Serving 模型服务

Redis 在线特征数据库

Jetty Server 推荐服务器

JS 前端实现

 

以上这些在内的,一整套深度学习推荐系统。不说它能支撑起一个中大型公司的推荐系统,可是毫无疑问,它能够成为一个工业级推荐系统的种子项目。而这一切,都能在课程里,一步步尝试搭建起来。

 

最后你实现的推荐系统会是这个样子👇

 

SparrowRecSys的首页

 

SparrowRecSys的类似电影推荐页

 

在这些前端页面的背后,是你能实现的一个又一个深度学习模型

 

  • 对于电影的类似推荐功能,王喆会使用各类 Embedding based 的方法,好比 item2vec,graph embedding 等等。

  • 对于推荐功能,会基于 TensorFlow 实现Embedding MLP,Wide&Deep,NerualCF,Two Towers,DeepFM,DIN 等等深度学习模型,而后使用 TensorFlow serving 去进行模型服务。

  • 对于召回层、排序层这些推荐逻辑,也会全盘在基于 Jetty 的推荐服务器中实现。

 

整个项目总体的技术架构是下面这个样子的:

 

SparrowRecSys的技术架构

 

是否是感受很牛。其次,专栏本计划是 30 讲,生生写到 43 讲,补充讨论了不少热门的问题。在这里贴 15 个专栏里讨论的问题,看专栏留言区的讨论,感受收获更大。

 

 

最后说说,他是怎样讲解这门课程的?


总体遵循了经典推荐系统的框架,分为 6 部分,学懂了,实现一个工业级的深度学习推荐系统,不成问题,简单介绍下:

 

基础架构篇:讲要从 0 开始实现的推荐系统, Sparrow RecSys 的主要功能和技术架构,也会用到 Spark、Flink、TensorFlow 等业界最流行的机器学习和大数据框架。

 

特征工程篇:讨论推荐系统会用到的特征,以及主要的特征处理方式,并将其实践在 Spark 上。此外,还有深度学习中很是流行的 Embedding、Graph Embedding 技术,并带你实现 Sparrow Recsys 中的类似电影推荐功能。

 

线上服务篇:带你搭建一个推荐服务器,包括服务器、存储、缓存、模型服务等模块和相关知识,涉及 Jetty Server, Spark、Redis 的使用。

 

推荐模型篇:深度学习推荐模型的原理和实现方法,包括 Embedding+MLP ,Wide&Deep,PNN 等深度学习模型的架构和 TensorFlow 实现,以及注意力机制、序列模型、加强学习等相关领域的前沿进展。

 

效果评估篇:效果评估的主要方法和指标,创建起包括线下评估、线上 AB 测试、评估反馈闭环等整套的评估体系,真正可以用业界的方法,而不是实验室的指标来评价一个推荐系统。

 

前沿拓展篇:讲 YouTube、阿里巴巴、微软、Pinterest 等一线公司的深度学习应用,帮你追踪业界发展的最新趋势。

 

能够说,王喆老师的书也好,课也好,从未叫人失望过,并且他人也特别 nice,常常在专栏下面跟读者留言互动,这种耐心和责任心,真不是通常人有的。

 

好了,再强调一遍

专栏原价 ¥99,秒杀 ¥79

叠加优惠口令「shendu666

到手 ¥69,至关于半价了

立刻就涨到 ¥129 啦

 

 

👆扫码免费试读

 

没计划的学习,都只是做秀。与其花时间找一堆资料,还不若有计划的消化一个系统的课,更值。

 

👇点击「阅读原文」,记得用口令「shendu666」,到手仅¥69,立刻涨价到 ¥129 了。

本文分享自微信公众号 - NewBeeNLP(NewBeeNLP)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索