京东电商搜索中的语义检索与商品排序( 三 )


我们还加入了 Graph 学习方法对 id 类特征 embedding 进行 pretrain,然后加入到模型训练中 。具体方法使用用户的高质量点击行为生成商品 graph,通过 Random Walk 生成训练数据,然后利用 Skip-gram 进行训练,加入 id embedding 可以提高模型离线指标和收敛速度 。

京东电商搜索中的语义检索与商品排序

文章插图
 
3. 时效性优化
值得一提的是,为了增强排序捕捉变化的能力,提升排序的流动性,我们从三个方面:特征时效性、模型时效性、线上预估校准进行了优化 。
  • 提升特征时效性:接入商品小时级的点击加购订单等实时信号,训练模型学习实时变化
  • 实时在线校准:根据商品全站的点击订单等实时反馈信号,对模型原来的预测分数及时校准
  • 提升模型的更新频率:优化训练数据生产流程,推动训练平台升级,提升模型训练速度
搜索排序是商品检索最重要的模块之一,我们在个性化、时效性、多目标等方向不断迭代,提升了排序体验,也提升了商品成交量 。
04
总结
我们介绍了语义检索召回和商品排序,在京东搜索服务上部署并取得了良好效果 。我们还在尝试一些业内其他流行的方法,比如 GNN、KG、MMoE 等方向,也获得了不错的成绩 。
文章作者:
王松林、唐国瑜,京东算法工程师 。
团队介绍:
京东搜索应用科学部,负责京东商城商品搜索排序算法,覆盖京东主站,京喜,微信一级入口的京东搜索 。团队成员有来自国内外大厂,也有来自中清北的优秀毕业生 。我们致力于用技术驱动产品,用行业前沿的先进技术落地业务场景;从实际需求出发,用技术解决实际问题,做有用并且有趣的算法,我们也乐于把实践经验通过论文分享给业界 。欢迎有技术情怀、有创新活力的你加入我们!

【京东电商搜索中的语义检索与商品排序】


推荐阅读