纯策略纳什均衡计算-怎么求纯策略纳什均衡和混合纳什策略( 二 )
假如你有一个优势策略 , 你可以选择采用 , 并且知道你的对手若是有一个优势策略他也会照办;同样 , 假如你有一个劣势策略 , 你应该避免采用 , 并且知道你的对手若是有一个劣势策略他也会规避 。
但遗憾的是 , 并不是所有博弈都有优势策略 , 哪怕这个博弈只有两个参与者 。实际上 , 优势策略只是博弈论的一种特例 。虽然出现一个优势策略可以大大简化行动的规则 , 但这些规则却并不适用于大多数现实生活中的博弈 。
来看这样一个房地产开发博弈的例子 。假定北京市的房地产市场需求有限 , A、B两个开发商都想开发一定规模的房地产 , 但是市场对房地产的需求只能满足一个房地产的开发量 , 而且 , 每个房地产商必须一次性开发这一定规模的房地产才能获利 。在这种情况下 , 无论是对开发商A还是开发商B , 都不存在一种策略完全优于另一种策略 , 也不存在一个策略完全劣于另一个策略 。
因为 , 如果A选择开发 , 则B的最优策略是不开发;如果A选择不开发 , 则B的最优策略是开发;类似地 , 如果B选择开发 , 则A的最优策略是不开发;如果B选择不开发 , 则A的最优策略是开发 。这样就形成了一个循环选择 。
根据纳什均衡含义就是:给定你的策略 , 我的策略是最好的策略;给定我的策略 , 你的策略也是你最好的策略 。即双方在对方给定的策略下不愿意调整自己的策略 。
这个博弈的纳什均衡点不止一个 , 而是两个:要么A选择开发 , B不开发;要么A选择不开发 , B选择开发 。在这种情况下 , A与B都不存在优势策略 , 也就是A和B不可能只要选择某一个策略而不考虑对方的所选择的策略 。实际上 , 在有两个或两个以上纳什均衡点的博弈中 , 其最后结果难以预测 。在房地产博弈中 , 我们无法知道 , 最后结果是A开发B不开发 , 还是A不开发B开发 。
再来看这样一个警察捉小偷博弈的例子 。某个村庄上只有一名警察 , 他要负责整个村的治安 。小村的两头住着两个全村最富有的村民A和B , A、B分别需要保护的财产为2万元、1万元 。整个小村某一天来了个小偷 , 要在村中偷盗A和B的财产 , 这个消息被警察得知 。
因为分身乏术 , 警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家 。若警察在某家看守财产 , 而小偷也选择了去该富户家 , 就会被警察抓住;若警察没有看守财产的富户家而小偷去了 , 则小偷偷盗成功 。
一般人会凭着感觉认为 , 警察当然应该看守富户A家财产 , 因为A有2万元的财产 , 而B只有1万元的财产 。实际上 , 对于警察的一个最好的做法是 , 警察抽签决定去A家还是B家 。
因为A家的财产是B家的2倍 , 小偷自然光顾A家的概率要高于B家 , 不妨用两个签代表A家 , 比如如果抽到1、2号签去A家 , 抽到3号签去B家 。这样警察有2/3的机会去A家做看守 , 1/3的机会去B家做看守 。
而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗 , 只是抽到1、2号签去A家 , 抽到3号签去B家 , 那么 , 小偷有l/3的机会去A家 , 2/3的机会去B家 。这些数值是可以通过联立方程准确计算出的 , 笔者这里就不给出具体的数学计算过程了 。
细心的读者会发现 , 警察捉小偷博弈与前面所举的两个博弈案例有一个很大的差别 , 就是用到了概率的知识 , 警察与小偷没有一个一定要选择某个策略的纳什均衡 , 而只有选择某个策略是多少几率的纳什均衡 。
在博弈论中 , 可以选择出某个策略的纳什均衡 , 这个策略叫做纯策略 。
用专业的话来说 , 所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略 。但至少存在一个混合策略均衡点 。
所谓混合策略是指参与者采取的不是惟一的策略 , 而是其策略空间上的概率分布 。这就是纳什于1950年证明了的纳什定理 。而这个博弈没有纯策略纳什均衡点 , 而有混合策略均衡点 。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择 。
推荐阅读
- 再别康桥配音纯音乐下载 再别康桥背景音乐?
- 纯种松狮犬多少钱一只 纯种松狮
- 宋祖儿|朴恩斌新娘白纱造型曝光!气质清纯笑容甜美:粉丝大赞是最美仙女
- 青春纯真的梦初中作文
- 伊万卡|41岁伊万卡穿纯白健身裤,大长腿惹眼,腰臀曲线比卡戴珊美得真实
- 萧敬腾|萧敬腾自黑保星途,巧妙化解妈咪梗,网友表扬:公关策略更换及时
- 纯碱的性质 纯碱的用途
- 熔岩巨兽出装半肉半ap_LOL 对于熔岩巨兽来说,怎么出装,纯肉和AP半肉,一般出哪个?
- 纯真的近义词是什么词 纯真的近义词是什么
- 一款非常纯粹的载具拼接搭建类沙盒游戏 拼装游戏