LTR中RankSVM算法的基本思路是啥
【LTR中RankSVM算法的基本思路是啥】 Learning to Rank的思想是用机器学习模型解决排序问题。RankSVM是其中Pairwise的方法。
Pairwise方法的直观理解是,对于查询q, 若文档d1比d2更相关(d1\u0026gt;d2), x1、x2分别是d1、d2的特征,取(x1, x2)为正样本,(x2, x1)为负样本,训练一个二分类器对样本进行分类,就能将排序转化为一个分类问题,从而用机器学习的方法进行排序。RankSVM就是以支持向量机(SVM)为分类模型的Pairwise方法。
那么问题来了,怎么标注文档d1比d2更相关呢?答案是利用点击(Clickthrough)数据。假设查询“support vector machine”,得到如下查询结果,用户最终点击了文档1、3、7。因为用户倾向于点击排在前面的文档,所以若用户点击了文档3而没有点击文档2,且文档2排在文档3前面,就可以认为文档3比文档2更相关。从这个case可以得到3\u0026gt;2, 7\u0026gt;2, 7\u0026gt;4, 7\u0026gt;5, 7\u0026gt;6。
■网友
将排序问题转化为分类问题,两个文档之间的先后顺序由他们的特征之差决定,两种减法,得到一正一负样本,然后得到超平面,最后用于每个query得到score,然后rank
推荐阅读
- 为啥这个算法误差的看起来这么小
- 使用算法帮助人们筛选reader的信息是否存在可能
- 请问如果想成为算法工程师的话,大学选专业是选软件工程好还是计算机科学与技术好。
- 神经网络算法是否真的属于人工智能范畴
- 以算法为例,是否存在讲解者认为“懂得自然懂了,不懂的我说再多也白搭”的心理
- 豆瓣FM的推荐算法还有哪些可以改进的地方
- 如果已确定图像中物体的位置, 常用的目标分割和提取算法有哪些
- 请问只靠优化软件可以提高手机信号质量吗就是说不改变基带芯片和天线设计,信号质量可以靠算法优化吗
- 网络台球的动量算法规则是咋写的
- 各种hash算法的值域是啥分布