数据分析中最好用的估算法 费米估算法的原理是什么

费米估算可以解决产品面试中的估算问题 。本文介绍了费米估算的由来、原理、方法和案例 , 与大家分享!
前段时间分析大厂产品的面试题 , 发现估题的概率挺高的 。比如估算北京一年出租多少套房子 , 估算一个城市的加油站等问题 , 似乎都没有已知的条件 。
查了相关资料 , 我们知道费米给出了一套解决这类问题的方法论 。
费米问题的本质在于把未知问题逐步拆解成已知问题 , 通过建模和生活经验给出粗略的估计 。本文将介绍费米估计以及如何解决这类市场规模估计问题 。
大纲:
费米估算:起源 费米估算的原理 如何用费米估算Market Sizing问题 案例分析 总结一、费米估算:起源 有这样一个故事:
在芝加哥大学的一堂课上 , 费米问学生 。芝加哥有多少钢琴调音师?学生一脸茫然 。费米建议将这个问题“分解成一些易于操作的小问题 , 然后鼓起勇气进行猜测和假设” 。
芝加哥有多少居民?可靠的估计是300万;平均每个家庭有多少人?4人;有多少家庭有钢琴?大概三分之一 , 那么全市大概有25万台钢琴;钢琴多久需要调音一次?平均五年 , 芝加哥每年有五万架钢琴需要调音 。调音师每天能给多少架钢琴调音?4帧;假设他一年工作250天 , 那么他一年大约调音1000架钢琴 。
由此 , 费米和学生们推测芝加哥大约有50个钢琴调音师 。
后来有人用电话簿验证 , 实际统计结果和费米的猜测非常接近 。
二、费米估算的原理 1. 费米估算的概念 费米估计是指解决未知结果的估计问题 , 把复杂的问题拆解成已知结果的小部分 。
对拆卸下来的简单零件赋予实际意义 。如果得不到结果 , 就继续再拆解一次 , 直到拆解的问题的所有部分都变成常识性问题或者相对容易解决 , 这样就逐渐把一个结果未知的问题搞清楚了 。
2. 平均律 在把复杂的问题拆解成已知结果的小部分的过程中 , 可能会有估计 , 那么这样的估计会给最终的结果带来很大的误差吗?
例如 , 在前面的例子中 , 费米估计芝加哥有1/3的家庭拥有钢琴 。如果当时估计是1/4 , 结果会不会不准确?
其实在费米估算过程中 , 我们并不是只有一个估算 , 而是会产生一系列的估算 。例如 , 据估计芝加哥有三分之一的家庭拥有钢琴 , 也有人估计一架钢琴平均每五年调音一次 。这些估计有些过高 , 有些过低 。相乘后 , 它们会相互抵消 , 回到更准确的平均值 。
费米估计并不是一切 。有一个很重要的前提 , 我们的估计是有实际数据或者生活经验支持的 。估计值不能偏离实际结果太远 , 要从实际结果和常识出发 。例如 , 费米正在估算芝加哥每个家庭有4个人 。如果要估算的话 , 我们不能通过拍脑袋直接估算出芝加哥每个家庭有10个人 。
这种脱离实际常识和数据的估计 , 其实就是瞎猜 。瞎猜怎么可能是对的?
三、如何用费米估算Market Sizing问题 最近分析了一些产品面试问题 , 发现有些大厂喜欢出这样的估算题 , 比如:
估计杭州每年的奶茶店规模?
杭州一家奶茶店卖多少杯奶茶?
杭州有多少家茶叶店?
这种问题被称为市场规模问题 。有些同学在面试的时候会遇到这种问题 。如果他们事先不知道这种问题 , 很难找到更好的答案 。
这种市场规模问题正好可以用费米估计法则来解决 , 这个法则把未知数逐步分解成已知的部分 , 从而把一个未知结果的问题逐步搞清楚 。
当将费米估计应用于市场规模问题时 , 该问题主要从需求侧和供给侧分解 。这两个角度可以解决80%的市场规模问题 。当然 , 有些不涉及商品规模和数量的问题 , 这两个角度可能解决不了 。
那么就有必要对这个问题进行数学分析 , 列出公式 , 拆解 。
费米估算步骤:
明确问题 分析是需求端问题还是供给端问题 , 或者两个角度都不是 问题拆解 , 列公式 计算在拆解一个问题时 , 我们主张按照MECE(互斥集体穷尽)原理 , 将问题逐层拆解成子问题 , 从而找到问题的根源 。


推荐阅读