病毒■死亡人数预测从20万到200万都有?弄个新冠病毒模型就这么难?

病毒■死亡人数预测从20万到200万都有?弄个新冠病毒模型就这么难?
图片

大数据文摘出品
来源:fivethirtyeight
编译:李雷、lin、钱天培
身处新冠肺炎疫情之中 , 每个人心里都在问 , 疫情到底有多严重?全球又一共会有多少人死于疫情?
鉴于有关新冠病毒的大量研究和数据收集 , 我们似乎可以很容易地找到答案 。
很简单嘛 , 死亡人数=易感人群数*感染率*死亡率 。 把这三个数字弄明白不就可以啦 。
真的是这样嘛?
先让我们来看看一些关于美国疫情的模型预测数字 。
根据《纽约时报》的报道 , 美国疾控中心(CDC)使用模型来预测疫情前景 , 得到的最好情况是将会有20万美国人死亡 。
而另一份来自伦敦帝国学院的研究报告 , 则因其基于模型的恐怖预测直接上了新闻头条 , 这份报告认为 , 如果人们不改变爱聚集等习惯行为 , 那么新冠病毒疫情将造成220万美国人死亡 。
不得不说 , 这两种预测有着惊人的差异 。 这种差异就像是美国每年因受伤和暴力而丧生的人数和其他国家因战争而死亡的人数之间的差距 。 换句话说 , 一个是我们日常生活中面对的数字 , 而另一个则会永远改变一个国家 。
那么 , 为什么差距如此之大?这就不得不说到模型这只“小怪兽”的本质 。
使用数学模型来预测未来对专家来说很有价值 , 即使各种模型之结果可能存在巨大差异 。
不过 , 要弄清这些不确定的结果及其随时间的变化并不总是那么容易 , 而且这么烧脑的东西可能还有害身心 。 这就是为什么我们要探究流行病模型 , 希望你了解这种不确定性后可以更好地理解各种预测 。
回到我们的简单数学模型 。
死亡人数=易感人群数*感染率*死亡率
病毒■死亡人数预测从20万到200万都有?弄个新冠病毒模型就这么难?
图片

N(死亡) = N(易感人群) * 感染率 * 死亡率
看上去挺简单的吧 。 然而 , 当你开始尝试填入变量的值时 , 你会发现你根本不知道该填什么 。 每个变量都有多种选择 , 也取决于各人的知识差距 。
比如基本的数据输入 。 不同的国家和地区以不同的方式收集数据 。 没有一个统一的表格可以让我们轻松地比较世界各地的病例和死亡情况 。 即使在美国 , 许多医生也认为因新冠病毒而死亡的人数远超真正上报的数据 。
类似的情况还存在于各国的检测机制中 。 一些国家提供检测给任何想要进行检测的人 , 其他则不是 。 这使我们很难真正了解到底多少人实际感染新冠病毒以及有多少人检测呈阳性 。
而且 , 病毒本身的传染性是无法预测的 , 其对某些社会群体的伤害会更大 。 这意味着 , 病毒的社会影响将由各地的人口统计特征和医疗保健渠道所决定 。
让我们来具体看看这个模型涉及的数据吧 。
病死率
病毒■死亡人数预测从20万到200万都有?弄个新冠病毒模型就这么难?
图片

“一些人死于新冠病毒” , 这也许是我们在这里可以做的最后的一个绝对陈述 。
很可惜 , “一些”不是数字 , 不能用来进行数学计算 。
【病毒■死亡人数预测从20万到200万都有?弄个新冠病毒模型就这么难?】事实上 , 从疫情一开始就计算病毒的致死率是不准确的 。 各社会群体之间的病死率差异很大 。 加州大学旧金山分校的生物统计学家Rae Wannier表示:“由于年龄是一个很重要的因素 , 你必须根据美国人口构成以及并发症的发生率来调整病死率 。 ”(并发症是可能加重新冠病毒影响的其他潜在病症 。 )
换句话说 , 不是只有一个“病死率” , 而是有很多个 。 美国的病死率将不同于糖尿病发生率较低的国家的病死率 。 同样地 , 美国国内各地区的病死率也是这样 。 如果病毒在有大量老龄人口的城市传播 , 其病死率会比人口较为年轻的城市要高 。


推荐阅读