难于预测|归因分析指南v1.0( 四 ) 归因|分析|指南|

简单来说，同一组数据，整体的趋势和分组后的趋势完全不同。从统计学家的观点来看，出现辛普森悖论的原因是因为这些数据中潜藏着一个魔鬼——潜在变量lurking variable。

文章图片
最著名的辛普森悖论的实例，就是1973年加利福尼亚大学伯克利分校性别歧视案的例子。如果只看整体录取率，那么男生的录取率是44%，女生的是35%。而如果拆开来看，在6个院系的4个里，女生的录取率大于男生。如果按照这样的分类，女生实际上比男生的录取率还高一点点。在这个案例中，辛普森悖论出现的原因是，女生更愿意申请那些竞争压力很大的院系（比如英语系），但是男生却更愿意申请那些相对容易进的院系（比如工程学系）。这不就是归因所要挖掘的洞见吗？

文章图片
不少统计学家认为，辛普森悖论的存在，提醒我们不可能光用统计数字来推导准确的因果关系。因为数据可以用各种各样的方式分类，然后再进行比较，所以理论上潜在变量无穷无尽，你总是可以用某个潜在变量得到某种结论。
我们能做的，就是仔细地研究分析各种影响因素，把各种分类方式（不同模型）对比研究分析。
以上为全文，总结下：
归因是描述因果关系的一种分析方法，我们需要明确影响因素，在影响因素的范围下进行归因分析。
各个领域的应用，需要结合业务具体的情况，设定一些基本的假设，例如数字营销有点击归因等模型，投资决策有分配、选择、相互作用的模型。
产品上，不仅仅是归因，还要解决洞察问题。洞察实际上就是有趣的结论，我们可以使用机器学习自动挖掘到有趣的结论（结合洞察分类）
产品最小闭环：度量-优化-计划。
归因除了基于规则的实现，还有机器学习的实现方式，称为算法归因。
归因也可以从辛普森悖论里获得结论。
参考文献：
https://agencyanalytics.com/blog/marketing-attribution-models
https://zhuanlan.zhihu.com/p/90165817
https://arxiv.org/pdf/1703.01365.pdf
https://www.microsoft.com/en-us/research/uploads/prod/2016/12/Insight-Types-Specification.pdf
https://www.microsoft.com/en-us/research/uploads/prod/2019/05/QuickInsights-camera-ready-final.pdf
相关链接、更多资料查阅
???
「 Mix+人工智能」专刊
每期由mixlab社区精选。收录人工智能的相关内容，包括AI产品、AI技术、AI场景、AI投资事件、AI的思维方式等，MIX的主题包括：AR、VR、计算设计、计算广告、智能设计、智能写作、虚拟偶像等。
智能时代，人与人之间的差距，体现在AI使用能力上
To Be Continued
【难于预测|归因分析指南v1.0】……

难于预测|归因分析指南v1.0( 四 )

推荐阅读

宋雨琦事件，狂热粉丝，应该降温了。

铭月妈咪|若赶上这3个“时间”，暗示孩子有福气，孩子出生时间有讲究

独立|杭师大钱江学院回应“将停办”：已成立专班推进转设

|魔兽WLK：一件蓝色饰品，全职业看到都点需求，诸多理由令人无奈

在平时生活中怎样养生

幼儿园老师发午餐照后被撤回，细心家长秒截图：请给个解释

小积木全新视角|咖啡和它是绝配，细腻香甜，唇齿留香，一定要试试，秋天下午茶

马斯卡彭能做什么?马斯卡彭是什么?

支付宝|当年的支付宝锦鲤被人羡慕，现在却要1元转让了？

请叫我绅士|开学第一天在俺口袋里塞了一把酸枣，开心笑话：姥姥特别疼俺

石立薇|《1921》剧照曝出，黄轩寸头照太“丑”引争议，瞬间老了十岁？

『乐居网』底价20.1亿元，天津国资委拟转让天津交通集团100%股权

枸杞■天然的“雄激素”找到了，男人没钱也要多吃，保持年轻有活力

中国青年网|资产泡沫警报响起，美国经济正式衰退：“长期失业大军”被低估

最高检点名孙政才、王三运、秦光荣、陈刚：对48名“老虎”提起公诉

吹风机催熟菠萝蜜方法

岳云鹏|岳云鹏占王丽坤便宜？郭德纲当众一巴掌，节目录制曾一度失控

HIV|如何远离艾滋病？

春季有效减肥如何饮食水果搭配汤粥最科学

拇指伸不直，掰直了弯不回来还痛，因为啥？