文本获取和搜索引擎之推荐系统

时间 2019-12-06

标签文本获取搜索引擎推荐系统栏目搜索引擎繁體版

原文原文链接

coursera课程 text retrieval and search engine 第六周推荐。学习

推荐系统

推荐系统即把恰当的内容推送给用户，相似于在一系列文档中过滤出用户想要的。通常有两种方式:.net

经过向量模型能够作以下改进3d

向量学习系统即调整向量自己的位置，和搜索相似cdn

阈值模型困难在于：能被用户判断的数据都是送给用户的；开始的时候被标记的数据少；提供给用户一些试点的数据，看用户如何反应，太少了达不到效果，太多又会担忧都是用户用不到的数据blog

y轴是实际的做用（好比有点击的），x轴是排序中的位置；排序

$\theta_{zero}$ 表示继续调低阈值那么推送过去的都是无效的; $\theta_{optimal}$ 表示阈值的上界，即只要大于这个阈值，基本都是有效的。它和 $\theta_{zero}$ 之间还有可能存在必定的数据是有用。衡量真实的取值则能够用 $\alpha$ 来表示:文档

通常来讲，更偏向于 $\theta_{zero}$ ，这样获得的数据显得更全面。可是有时候不须要显示这么多，能够经过训练来达到另外一种取值方式it

当训练的样本数足够的时候，认为已经足够了解用户了，那么 $\alpha$ 能够取较小的值，不够的时候，偏向于 $\theta_{zero}$ ）便可；训练样本的权重则经过 $\gamma$ 来控制