科技刀|难倒80%数据分析师的面试题!看看你能答上来几道?

整理了数据分析面试中11道常见的面试真题 , 对初级数据分析师来说有一定难度 , 能全答对的估计不超过20% , 看看你能答对几道:
【科技刀|难倒80%数据分析师的面试题!看看你能答上来几道?】统计学部分
1、一副扑克牌一共54张 , 平均分成2份 , 求这2份都有2张A的概率
科技刀|难倒80%数据分析师的面试题!看看你能答上来几道?
文章图片
答案
先求分母:
54张牌 , 分成2份 , 每份应该27张 。
第一步:我们从54张牌取27张 , 作为第一份 , 就是C(54,27)
第二步:剩下的27张牌取27张 , 作为第二份 , 就是C(27,27)
这样分母就有了:把第一步和第二步相乘 , 就是54张牌 , 随机平均分成2份的组合数量 , 因此分母=C(54,27)*C(27,27)
再求分子:
一副牌有4张A , 50张非A的牌 。
为了保证两份都要有2张A , 在挑第一份的时候 , 应该先在4张A里面挑2个A , 50张非A的牌里挑25个非A 。 然后第二份就是在剩下的2个A里挑选2个 , 25个非A里面挑25张 。
第一步:从4张A里挑2张A , 50张非A里挑25张 , C(4,2)*C(50,25)
第二步:从2张A里挑2张A , 25张非A里挑25张 , C(2,2)*C(25,25)
分子:C(4,2)*C(50,25)*C(2,2)*C(25,25)
所以概率是:
C(4,2)*C(50,25)*C(2,2)*C(25,25)/C(54,27)*(C27,27)
=(27*13)/(53*17)
2、男生录取率增加 , 女生录取率增加 , 总体为何减少?
科技刀|难倒80%数据分析师的面试题!看看你能答上来几道?
文章图片
答案
此题考查的是辛普森悖论 , 因为男女的录取率可能有较大差异 , 同时低录取率群体的占比增大 。
如原来男性20人 , 录取1人;女性100人 , 录取99人 , 总录取率100/120 。
现在男性100人 , 录取6人;女性20人 , 录取20人 , 总录取率26/120 。
即那个段子“A系中智商最低的人去读B , 同时提高了A系和B系的平均智商 。 ”
3、置信度与置信区间是什么意思?
科技刀|难倒80%数据分析师的面试题!看看你能答上来几道?
文章图片
答案
置信区间是我们所计算出的变量存在的范围 , 置信水平就是我们对于这个数值存在于我们计算出的这个范围的可信程度 。
举例来讲 , 如果我们有95%的把握 , 让真正的数值在我们所计算的范围里 。
那么在这里 , 95%是置信水平 , 而计算出的范围 , 就是置信区间 。
如果置信度为95% , 则抽取100个样本来估计总体的均值 , 由100个样本所构造的100个区间中 , 约有95个区间包含总体均值 。
4、p值的含义
科技刀|难倒80%数据分析师的面试题!看看你能答上来几道?
文章图片
答案
假设检验的基本原理只有3个:
一个命题只能证伪 , 不能证明为真在一次观测中 , 小概率事件不可能发生在一次观测中 , 如果小概率事件发生了 , 那就是假设命题为假证明逻辑就是:
我要证明命题为真——证明该命题的否命题为假——在否命题的假设下 , 观察到小概率事件发生了——否命题被推翻——原命题为真
比如:要证明A是合格的投手——证明“A不是合格投手”这个命题为假——观察到一个事件(比如A连续10次投中10环) , 而这个事件在“A不是合格投手”的假设下 , 概率为p , 小于0.05——小概率事件发生 , 否命题被推翻 。
可以看到p越小——这个事件越是小概率事件——否命题越可能被推翻——原命题越可信
5、怎么向小孩子解释正态分布
科技刀|难倒80%数据分析师的面试题!看看你能答上来几道?
文章图片
答案
先拿出小朋友班级的成绩表 , 每隔2分统计一下人数(因为小学一年级大家成绩很接近) , 画出钟形 。 然后说这就是正态分布 , 大多数的人都集中在中间 , 只有少数特别好和不够好 。


推荐阅读