|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)( 四 )


为了定量求解获胜概率 , 我们需要对期权定价做一些改进 , 因为期权标的资产收益率为无界变量 , 而这里大选投票为有界量 , 因此我们加入代表投票票数的随机变量Y , 将满足布朗随机游走的无界变量X映射到Y上 , 并使得Y为鞅过程 。 在非线性变换下 , 此时的X不满足鞅过程 。
可能有人会问为什么不通过直接假设变量Y为有界Beta分布的形式来求解 。 原因在于数学上目前无法通过有界分布逆推随机过程 。 采用影子随机变量巧妙的解决了这一点 , 方便以期权定价求解获胜概率 , 并可以延展到不同的时刻观察获胜概率变化 。
由此构建下图所示的结构 , 其中B为二元选举结果 , Y为投票数 , X为定义在R上的影子变量(方便计算用)
|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图
|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

有了这样的工具 , 我们可以通过不同时刻观测到的支持率推出真正的大选获胜概率(考虑获胜概率波动后) , 其无套利条件下的真实值会相对接近0.5 , 远远小于我们所看到的支持率波动 。 不过这里有一个很重要的假设是波动率保持不变 , 实际上随着大选的进行 , 有关候选人的信息逐渐披露 , 支持率的波动也将减小 , 真实世界的合理定价介于两者之间 。
|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

第八部分 有界肥尾分布
有界帕累托分布
|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

操作风险:公司操作风险的损失上界为全部市值 , 通过破产的方式截断
再保险保单:再保险的保单存在很大的保额上限
战争伤亡:上界为全球总人口数
信用风险:一笔贷款的损失上界为全部资本金
城市规模:城市人口的分布极度肥尾 , 上界也为全球(国家)总人口数
环境破坏:破坏的面积上界为地球总面积
公司盈利规模:一个公司的盈利上界为全球(国家)GDP
|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图
在面对这样的情况时 , 为了拟合并求解分布均值 , 目前有两种方法:
1)假设帕累托分布的尾部于H处截断 , 将超出部分的概率重新按比例加回到[L,H]区域
2)假设H处为帕累托尾部的吸收态 , 超出H的概率通过狄拉克函数的形式加到H点
这两种方式在计算时由于概率密度的跃变 , 并不适用于极值理论 。 这里提出第三种方式——通过无界的中间分布实现概率密度的连续 , 并求解条件均值 。 假设随机变量Z满足:
|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

|戴国晨专栏 | 塔勒布量化开篇之作《肥尾分布的统计效应》(下)
本文插图

大规模战争和动乱的尾部概率
在人类历史上 , 战争和动乱是造成大量人员伤亡的主要因素 。 传统和战争相关的的统计分析主要聚焦于优化不完善和不可靠的数据集 。 这里开辟一个新的视角 , 通过极值理论观察历史上战争造成人员死亡的分布 , 并按照有界帕累托分布 , 通过截断尾部的形式估计伤亡均值 , 战乱事件发生的周期和相关性 。 通过该研究尝试回答一个问题:随着历史的发展 , 战乱的发生概率或伤亡规模是否有降低的趋势?


推荐阅读