快手因果推断与实验设计 实验设计方法( 二 )



当治疗应用于一个组或区域时 , 很难找到单一的对照组 。在这种情况下 , 使用合成控制方法来构建用于比较的虚拟控制组 。其原理是构建一个虚拟对照组 , 通过治疗前从数据中学习到的权重 , 拟合实验前实验组的数据 , 模拟实验组用户未接受实验的结果 , 构建一个合成对照组 。实验开始后 , 评估实验组和综合对照组之间的差异 。
2.推荐策略评估:因果推理和机器学习 。

因果分析和机器学习有一些区别 。因果分析的语言 , 核心在于因果关系的认定 , 即合理估计处理前后现有条件和预期的差异 , 或处理数据缺失的问题 。在因果推理中 , 我们非常关心如何准确地估计结果和结果的方差 。在机器学习中 , 我们使用精度来衡量机器学习模型的质量 , 其目标是估计训练集上的条件期望 , 从而最小化测试集上的均方误差 。机器学习可以通过交叉验证 , 用数据驱动的方法选择最优的模型形式 。与传统的计量经济学方法相比 , 它不需要复杂的假设 , 如函数形式的假设 。从这个意义上说 , 机器学习可以更准确地预测 。
然而 , 在因果推理问题上 , 机器学习的局限性在于 , 无论使用何种机器学习方法 , 因果识别的条件都不能放松 。同时 , 机器学习模型中常用的正则化和过拟合会导致有偏估计 , 因此需要消除这种估计的偏差 。在统计推断中 , 机器学习的局限性在于有些模型不能直接计算方差 , 有时即使可以计算 , 方差的收敛速度也可能达不到预期 。因此 , 为了解决这些问题 , 下面介绍几种方法 。
①双机学习模型 。

在很多情况下 , 因果推理会遇到混淆变量的问题 , 比如试图分析直播推荐的多样性对用户活动的影响 , 但这些都与用户历史有关 。传统的计量经济学方法可以解决这个问题 , 但它们依赖于许多强有力的假设 。在强假设下 , 估计不一定合理 。双机器学习为这个问题提供了解决方案 。
对偶机器学习假设所有混淆的变量都可以观察到 , 其正则化过程可以达到选择高维变量的目的 。该模型类似于弗里希-沃夫-洛弗尔定理 , 通过正交化解决了正则化带来的偏差 。
除此之外 , 还有一些问题需要解决 , 如ML模型中的偏差和估计有效性 , 可以通过样本分裂和交叉拟合来解决 。具体方法是我们把数据分为训练集和估计集 。在训练集中 , 我们使用机器学习分别拟合影响 , 在估计集中 , 我们根据拟合得到的函数估计残差 。这样 , 我们就可以纠正偏差 。在偏差修正的基础上 , 我们可以为整个估计方法构造一个矩条件 , 并推导出置信区间 , 从而得到一个具有良好统计量的估计 。
②因果随机森林模型 。

我们通常会探讨策略对不同用户异构性的影响 , 即哪些用户更容易受到影响 , 影响有多大 。传统的方法是多维分析 , 但效率低 , 容易出错 。这时可以结合机器学习的方法 , 这里选择决策树的方法 , 因为决策树的分桶特性可以帮助解决异构问题 , 与传统的果树方法相比有两个变化:
数据分为训练集和估计集 , 一部分训练集构造树 , 另一部分估计集估计因果效应和方差 。
在树分割的方式下 , 利用每个节点的方差来修正目标函数 。
通常 , 我们结合资源网络的实验进行分析 。例如 , 在实验中 , 通过果树得到因果效应分布 , 然后选择实验效果显著的用户 , 分析其特征 , 找到敏感用户 , 帮助我们理解策略的影响 , 进行下一次迭代 。
③提升建模元学习器

隆起建模是另一种定位敏感人群的方法 , 不同于果树 。核心是利用实验数据对实验结果变量进行建模 , 利用得到的模型估计条件平均处理效果 。提升建模有不同的学习方法 , 主要包括S学习者、T学习者和X学习者 。与果树相比 , 元学习器是一种间接建模方法 , 实现速度快 , 但在某些场景中误差较大 。


推荐阅读