贝叶斯结构模型在全量营销效果评估的应用( 六 )


图像显示模型能够通过 AA校验 , 模型有效 。在干预点之后 , 实际值较预测值有所提升 , 但提升的置信区间含0 , 因此未达到显著程度 。体现出2022年端午营销策略对于转化人数有所促进作用 , 但是效果未达显著 。
六、方法优缺点相较于传统因果推断方法 , BSTS模型有2个主要优点:

  • 能够识别出数据背后的结构化特征 , 更好的做出预测;
  • 利用了贝叶斯估计的思想 , 得到参数的后验分布情况 , 计算效应值时能够给出置信区间 。但第(2)点对于BSTS模型是一把“双刃剑” , 如果先验分布设置得不好 , 会影响MCMC的收敛速度和方向甚至最终的后验分布情况 。因此对于先验分布的选取需谨慎 。
七、方法拓展本文介绍的结构化时序模型将数据的周期特点拆分成了趋势项、季节项、周期项等等 , 每种元素挨个探究 。更进一步 , 我们可以将时间序列按照周期性的长短来进行拆分 , 分为长周期项(使用大滑动窗口)、短周期项(使用小滑动窗口)、季节项等等 。这样的好处是防止一些小窗口内的周期情况被长周期的信息平滑掉 , 能够更好的体现出数据在不同程度上的周期特点 。具体的方程可以拆分成如下形式:
贝叶斯结构模型在全量营销效果评估的应用

文章插图
其中
贝叶斯结构模型在全量营销效果评估的应用

文章插图
表示不同时间点的状态值;4个模块分别代表长周期项/短周期项/季节项/序列相关性项(带有协变量X);每个结构模块都有一个均值和一个标准差 。
贝叶斯结构模型在全量营销效果评估的应用

文章插图
图7-1展示了某时间序列背后的4个模块:从上至下以此表示:原数据情况;季节性因子;短周期项;相关性项;长周期项 。短周期来看数据的波动比较明显;长周期来看数据波动较不明显 , 因此这里需要考虑到短周期内的数据结构 , 避免被长周期的数据平滑 。
接下来对以上4种模块分别进行预测 。针对长周期和季节性 , 由于他们在短时间内的变化不大 , 因此可以直接使用对应方程中的μ和σ来进行预测;针对短周期项和相关性项可以通过其他机器学习方式进行预测 。得到各个模块的预测结果之后 , 结合各模块特征进行融合 , 得到整体的预测结果 。参考文献[4]中给出了更具体的预测方式和与传统方式的对比结果 。
贝叶斯结构模型在全量营销效果评估的应用

文章插图
图7-2展示针对长短周期不同的预测方式:长周期项与季节项可以直接用μ表示预测;短周期及协变量相关项使用自定义的机器学习模型进行预测 。
依照上述方法得到的时序预测模型后 , 我们再将其代入CausalImpact的代码中 , 调整参数model为自定义的时序模型即可 。
八、总结本文介绍了用因果推断的方式评估某一政策作用于时间序列数据带来的效应 , 使用了BSTS的状态空间模型来进行反事实值的预测 , 并通过CausalImpact的代码进行实现 。
不同于其他因果推断方法的框架 , 本文中的方法对所有超参数进行贝叶斯估计 , 再对后验分布进行MC采样得到反事实的预测值 , 主要优势是能够根据最大程度考虑到所有对照组以及实验组自身的结构特点 , 给出反事实预测值的估计以及置信区间 , 衡量效应值的显著性 。
同时 , 本文介绍的方法主要聚焦于结构化时序数据 , 利用BSTS模型识别观测数据背后的状态值以及各个状态之间的转化情况 , 进而在进行反事实预测时 , 尽可能消除由隐藏状态带来的影响 。
需要注意的是 , 使用BSTS模型之前 , 需要验证数据是否真的有周期性特点以及结构元素是怎样的(是否是长短周期等等) , 再挑选合适的时序模型来训练;同时对于参数的先验分布设置也需谨慎 , 尽可能使得最终的效应估计值科学稳定 。

【贝叶斯结构模型在全量营销效果评估的应用】


推荐阅读