从零搭建推荐系统—算法篇( 三 )


从零搭建推荐系统—算法篇

文章插图
 
预测服务
到此通过算法模型给出个性化排序的流程就打通了 。关于模型打分步骤对于基于DNN的模型TensorFlow有专门tf.server用于部署生产环境的模型预测服务,TensorFlow也有为服务端语言golang/JAVA/C++等专门适配
对于传统机器学习模型LR、GBDT等,可以将模型特征id及权重直接序列化为文件,在排序服务端定时加载解析,打分预测时直接使用特征id及其权重值运算即可 。
番外【从零搭建推荐系统—算法篇】推荐系统算法侧主流程架构大体就是这样,已经可以跑通一个基本模型并应用于线上观察效果 。后续算法侧的迭代优化,一方面可以跟进业界前沿的模型方法,一方面通过分析用户行为与业务数据来尝试在特征和样本数据层面做优化,而后者可能才是产生更直接收益的法宝,毕竟不是所有公司都能有google阿里家那种量级的用户数据,复杂模型应用起来因为过拟合的问题甚至带来负向效果 。反过来说大厂在模型上的创新也是基于不断分析累积用户行为的经验得来,比如yutube关于视频推荐的论文:
https://zhuanlan.zhihu.com/p/82584437
也是分析用户点击一个视频不一定是很喜欢,而可能和正好排在前面有关,从而设计模型结构将排序位置特征引入模型,通过多目标学习将这种实际样本“有偏”的影响消除 。




推荐阅读