|用户画像规划流程和方法( 二 )


聚类算法:聚类算法较多 , 如ANN神经网络和贝叶斯等 , 聚类主要是针对冷启动用户、用户分群营销等目的;具体算法相对复杂 , 目前算法应用多使用python的各种库如Sklearn , 包括一些框架tensorflow、caffe等 。
相似度模型:一般使用相似度模型进行辅助用户分群 , 常用的有逻辑回归、线性回归、余弦相似度、皮尔森相似度等 。
具体说下余弦相似度:
|用户画像规划流程和方法
本文插图

实例:
|用户画像规划流程和方法
本文插图

用户1和用户2通过公式计算相似度为0.945406 , 是不是可以解释为两个用户可以划分为同一类人 , 进行用户分群(计算过程只是用于解释算法 , 无其他意义) 。
若已有数据仓库 , 数据采集相对比较轻松 , 可参考文章“每日优鲜如何搭建数据仓库?” 。
2. 用户维度分析
用户分析具有多维度 , 随时间更新的特点 , 包括用户年纪、学历、兴趣、消费水平等都容易变化 。
因此维度信息应该随着用户偏好发生变化 , 因此 , 在标签系统中需要有新增标签功能 。
|用户画像规划流程和方法
本文插图

3. 维度标签化
用户画像最终的实现应该是对维度进行标签化 , 常用MECE法则进行标签化 , 防止标签界限不清晰 。
标签需要根据需要进行逐级拆分 , 例如:
|用户画像规划流程和方法
本文插图

4. 标签映射 , 接口封装
用户画像数据导入服务器中 , 为后续推荐系统 , 营销活动服务;封装成API可以作为数据服务的内容 , 对其他系统提供数据支持 。
5. 用户画像评估
对画像进行评估:
用户覆盖率:用户画像具体能够覆盖到多少用户 , 有些用户画像可能覆盖总用户的50%或者80%;所以覆盖率是用户画像应用的一个评价 , 覆盖率越高 , 对后续精准营销的策略选择越准确 。
准确率:模型的准确性 , 如上所述 , 使用算法模型导致的用户分群错误或者对用户的购买意向预测错误 , 将直接影响购买率 , 影响GMV 。
可拓展:用户画像在维度刻画应该是可扩展的 。
及时性:如果用户画像服务到实时推荐系统中还需要用户画像的及时 。
四、总结
用户画像结合大数据技术使用户刻画更加细致、及时 , 对日趋竞争激烈的互联网浪潮起到越来越重要应用 。
本文由@汪仔2296 原创发布于人人都是产品经理 , 未经许可 , 禁止转载 。
题图来自Unsplash, 基于CC0协议


推荐阅读