机器学习之排序学习

时间 2020-12-25

标签算法网络机器学习函数学习优化搜索引擎 3d blog 排序栏目系统网络繁體版

原文原文链接

Learn to Rank

排序学习主要用于搜索引擎，推荐系统等领域。算法

对于传统的排序算法，通常只能根据少许特征，而后经过人为设定的规则，来进行文档的全量排序。网络

然而对于排序涉及大量的特征，并且这些特征难以人为的编辑规则来进行文档和文档之间的比较，这就出现了排序学习。机器学习

排序学习经过以特征和文档为输入，经过机器学习或者神经网络的方法，最终输出对于某个查询，每一个文档的相关度分数，进而实现能够进行对文档的排序。函数

输出的0/1表明doc1是否大于doc2学习

能够直接应用之后的分类算法优化

i	reli	log2(i+1)	reli /log2(i+1)
1	3	1	3
2	2	1.58	1.26
3	3	2	1.5
4	0	2.32	0
5	1	2.58	0.38
6	2	2.8	0.71

i	reli	log2(i+1)	reli /log2(i+1)
1	3	1	3
2	3	1.58	1.89
3	3	2	1.5
4	2	2.32	0.86
5	2	2.58	0.77
6	1	2.8	0.35

能够看出，IDCG是固定的，对DCG的优化过程，DCG的值呈现跳跃性改变，所以DCG是非连续函数，这致使以NDCG为表明的损失函数，很难使用现代的优化算法来优化。搜索引擎

因为NDCG的非连续性，这就引入了lambda为梯度的损失函数3d

经过定义loss的梯度，不须要经过求导，而是直接求得lambda的梯度，而后经过反向传播到上层的model，优化模型的参数，这样就避免了最后的loss是非连续函数不可导的缺点
最后梯度=lambda(i)
lambda>0，则趋于上升
lambda<0，则趋于降低