LTR中RankSVM算法的基本思路是啥

【LTR中RankSVM算法的基本思路是啥】 Learning to Rank的思想是用机器学习模型解决排序问题。RankSVM是其中Pairwise的方法。
Pairwise方法的直观理解是,对于查询q, 若文档d1比d2更相关(d1\u0026gt;d2), x1、x2分别是d1、d2的特征,取(x1, x2)为正样本,(x2, x1)为负样本,训练一个二分类器对样本进行分类,就能将排序转化为一个分类问题,从而用机器学习的方法进行排序。RankSVM就是以支持向量机(SVM)为分类模型的Pairwise方法。
那么问题来了,怎么标注文档d1比d2更相关呢?答案是利用点击(Clickthrough)数据。假设查询“support vector machine”,得到如下查询结果,用户最终点击了文档1、3、7。因为用户倾向于点击排在前面的文档,所以若用户点击了文档3而没有点击文档2,且文档2排在文档3前面,就可以认为文档3比文档2更相关。从这个case可以得到3\u0026gt;2, 7\u0026gt;2, 7\u0026gt;4, 7\u0026gt;5, 7\u0026gt;6。
LTR中RankSVM算法的基本思路是啥


■网友
将排序问题转化为分类问题,两个文档之间的先后顺序由他们的特征之差决定,两种减法,得到一正一负样本,然后得到超平面,最后用于每个query得到score,然后rank


    推荐阅读