内容推荐算法:异构行为序列建模探索( 四 )


兴趣强度的分布可以用直方图作可视化(图2-4 , 中间部分) ,那么怎么样的分布会倾向于较高的ctr呢? 是整体偏高但平缓 ,还是少数几个柱子鹤立鸡群的观感呢? 类比于图像特征的捕捉 ,我们用CNN作后续的特征提取 。
内容推荐算法:异构行为序列建模探索文章插图
图2-4.兴趣匹配强度 完整设计
? auxiliary loss 设计验证了兴趣匹配强度建模的有效性后 ,将其作为子模块迁回原有网络参与训练 ,再次遗憾地发现attention可视化分布中的对角线再次消失 ,离线指标也涨幅有限 。
内容推荐算法:异构行为序列建模探索文章插图
图2-5.添加辅助loss前 ,兴趣匹配强度参与logits加和 ,其值域跨度和分布形状皆不符预期 ,体现不出异构序列的应有贡献
模型可能也会偷懒,bias及prefer类特征规律性强 ,容易学习 ,就放弃了兴趣匹配子模块的学习 。 此时就要用 图2-1中In_CTR架构的loss处理方法 ,在其参与logits加和的同时 ,也为其独立出一个loss ,并分配合适的权重(实验中为0.65 ,较为激进) 。 再次试验并观察logits分布 ,符合预期 。
文末小总与展望用户行为序列是其兴趣与意图的原始表达 , 重要性等同于搜索场景下的query输入 。 商品行为作为异构序列 , 如何在跨domain的洋淘推荐中建模? 围绕这一挑战 , 我们创新性地提出了:

  1. In_Match , 用序列生成的task训练decoder , 抽取其顶层输出向量作内容召回 , 召回效果超越内容协同;
  2. In_CTR , 将motivation由常规的序列兴趣的直接表达转换为序列兴趣的匹配程度 , 并根据这一先验设想设计了辅助loss , 鼓励模型有所侧重地去学习 , 最终离在线指标上都有斩获 。
【内容推荐算法:异构行为序列建模探索】洋淘的发展方向是内容社区 , 所谓社区就要以人为本 。 未来我们会基于用户关注关系 , 兴趣下的用户分组等切面作推荐 , 也可以直接作“关注关系”的引导 , 诸如给出“你和ta都喜欢萌萌的治愈系挂件”这样的推荐理由 , 提升同好相吸的社区氛围 。


推荐阅读