精准推荐的秘术:阿里解耦域适应无偏召回模型详解( 三 )


3、有偏无偏联合训练 

精准推荐的秘术:阿里解耦域适应无偏召回模型详解

文章插图
 
以上模块有效地得到了商品的无偏内容表示和解耦的流行度表示,我们应该怎样去应用呢?我们利用了无偏模型和有偏模型联合训练的方式,无偏商品向量可以基于解耦模块及正则化提取,为了能够利用流行度信息,我们还引入了流行度特征,有偏模型只会继承流行度偏差,不会加剧偏差 。线上服务部分,如上图右边所示,我们将无偏的商品表示和有偏的商品表示通过参数 α 融合起来得到线上的商品表示,这样即可通过用户向量来召回商品,这个 α 是调节召回关注流行度信息的程度 。
4、离线及线上实验 
精准推荐的秘术:阿里解耦域适应无偏召回模型详解

文章插图
 
上图中展示了这个模型离线及线上的效果 。在离线实验中,我们引入了 C-Ratio 的指标,来衡量召回结果中有多少商品是高曝光商品 。通过离线实验我们可以看出各个模块都有一定程度的贡献 。无偏模型在线上效率指标方面并没有收益,说明流行度信息是有用的,我们还是需要使用有偏模型去利用流行度信息 。
精准推荐的秘术:阿里解耦域适应无偏召回模型详解

文章插图
最后,我们对模型结果做了可视化的展示 。我们发现新的模型结构的确可以将高爆商品和长尾商品的分布记性对齐,解耦出来的流行度表示向量和商品无偏的内容表示几乎是没有交集的,并且同类目的商品能有更紧密的联系,通过对 α 的调整,可以让模型有方向地去拟合用户的从众兴趣和真实兴趣 。
今天的分享论文标题是《Co-training Disentangled Domain Adaptation.NETwork for Leveraging Popularity Bias in Recommenders》 。
五、问答环节Q1:未曝光样本是怎么加入到样本中的?A1:离线生成的,针对一条样本,我们可以拿到目标正样本及对应的类目,然后离线地随机采样出若干个和目标正样本相同类目的商品,挂载到训练样本中 。
Q2:引入同类的未曝光样本,会不会增加学习难度?A2:引入的未曝光样本是没有标签的,是通过无监督的方式来进行分布对齐,可能会存在负迁移的情况,我们用了两个技巧来解决这个问题:曝光样本在域对齐损失上的梯度被停止,防止影响到任务损失;对于未曝光样本,可以引入精排分进行知识蒸馏 。
Q3:未曝光样本获取精排分成本会不会很高?A3:离线对样本用精排模型打一遍分,作为特征来使用,性能还好 。
Q4:未曝光样本是进精排未曝光的样本吗?A4:不是,这样大概率还是一个高爆品,我们使用的是全局同类目下随机采样的结果 。




推荐阅读