贝叶斯定理如何帮助赢得第二次世界大战破解日本海军密码JN25( 二 )


贝叶斯定理如何帮助赢得第二次世界大战破解日本海军密码JN25
本文插图
注意 , 我们已经用更有意义的符号和replaced替换了变量A , B 。 表示模型的参数 , 在本例中只是is的概率 , 这是所用硬币固有的特性以及我们试图推断的未知值 。 代表观察到的数据 , 即硬币落在正面和反面的次数 。
· ( |)是给定证据或数据 的概率 。 换句话说 , 我们的硬币落在头部上一定次数后具有特定值的概率 。 这称为后验 。
· (| )回答以下问题:观察给定的数据what的可能性是多少?这也是常客计算的东西 , 称为可能性 。
· ()是统计学家对any在观察任何数据之前 different的不同值具有多大可能性的信念 。 通常称为先验模型
· ()通常称为边际函数 , 它描述观测数据的概率 , 而与模型参数无关 。 它可以确保后验分布是规范化的 , 但是我们经常可以找到避免对其进行直接计算的方法 。
我们需要做的第一件事是确定一个描述投币实验的模型 。 和以前一样 , 二项分布是我们选择的功能:
贝叶斯定理如何帮助赢得第二次世界大战破解日本海军密码JN25
本文插图
数据D包括抛掷数和头部数 。 确定了可能性之后 , 我们现在必须选择一个先验 。 请记住 , 先验特征是统计学家在看到任何数据之前对参数belief的信念 。 因此 , 如果我们要与一个值得信赖的朋友打交道 , 我们作为贝叶斯人可以选择一个先验先验 , 先验先验在 = 0.5(公平硬币的价值)附近有一个尖峰 , 如橙色曲线所示 。 如果我们的朋友过去曾试图欺骗我们 , 我们可能会更倾向于选择蓝色曲线 。 它更宽 , 因此对any的任何特定值的信任程度降低 。
贝叶斯定理如何帮助赢得第二次世界大战破解日本海军密码JN25
本文插图
正如您可能已经注意到的那样 , 我们没有写下任何先前的方程式 。 不幸的是 , 贝叶斯推理中涉及的数学可能非常棘手 。 通常 , 积分无法通过分析来计算 , 因此必须求助于诸如蒙特卡洛采样之类的数值工具 。 因此 , 我们将依靠图来发展对贝叶斯统计的直观理解 。
比方说 , 在6次抛掷中 , 硬币正面落了4次 。 使用''低信任度''先验 , 后验分布( |)将如下所示:
贝叶斯定理如何帮助赢得第二次世界大战破解日本海军密码JN25
本文插图
如您所见 , 由于头部出现的频率是尾部的两倍 , 因此分布已转移到更大的值 。 我们可以将似然项解释为作用于先验分布的过滤器 , 仅让的值或多或少地与数据less一致 。
分布仍然相当广泛 , 因此我们得出结论 , 为了做出可靠的推断 , 我们需要更多的样本 。 经过20次抛掷并观察了15次头部之后 , 后部看起来像这样:
贝叶斯定理如何帮助赢得第二次世界大战破解日本海军密码JN25
本文插图
我们可以高度肯定地得出该硬币被操纵的结论 , 而且我们能够比普通人少投掷80枚硬币 。 谈谈有效利用资源!
现在您应该同意和我们的朋友一起玩吗?要看 。 如果她允许您选择正面还是反面 , 请押头!但是 , 如果她坚持要自己挑头 , 也许是时候找到一个新朋友了……
实际上 , 可以计算出该游戏的有利版本的预期收益:如果我们押一美元 , 我们的预期收益为
贝叶斯定理如何帮助赢得第二次世界大战破解日本海军密码JN25
本文插图
由于我们不知道的确切值 , 因此需要对它的概率分布进行积分:
贝叶斯定理如何帮助赢得第二次世界大战破解日本海军密码JN25
本文插图
对于最后一个表达式 , 我们实际上不需要计算任何积分 。 为了在后验分布下获得the的期望值(均值)的粗略近似值 , 只需查看所述分布就可以找到??≈0.7(精确值约为0.708) 。 所以


推荐阅读