概念陷阱:病死率、R0和群体免疫|大象公会

COVID-19全球大流行 , 各种流行病学概念名词频频出现在各种新闻报道中 , 如何理解这些概念 , 如何利用这些概念来支持或反驳相关的防疫政策?文|無定著一个搞数据的人 , 如果不问数据来源、数据质量、数据产生过程(data generating process) , 拿到数据 , 就直接跑模型 , 那TA一定不是一个好的数据科学家 。与此同时 , 跑模型还要意识到模型的假设是什么 , 和现实可能差的多远 , 包含了哪些参数 , 没有考虑到的参数有哪些等等等等 。 总的来说 , 就是George Box的那句名言——和现实的复杂程度相比 , 「所有模型都是错的 , 但是有些模型是有用的 。 」概念陷阱:病死率、R0和群体免疫|大象公会
· 「所有模型都是错的 , 但是有些模型是有用的 。 」COVID-19全球大流行 , 各种流行病学概念名词频频出现在各种新闻报道中 , 如何理解这些概念 , 如何利用这些概念来支持或反驳相关的防疫政策?本文就来谈谈 , 科学家们估算病死率(也称致死率)、R0和群体免疫这三个测量值的难度和误差 。病死率首先来看病死率(Case fatality rate)——我认为更合适的叫法应该是Case fatality ratio 。 Rate和Ratio最大的不同 , 在于Rate往往在分母中引入了时间维度 。这个测量工具是非常直观的 , 就是在一定时期内 , 在确诊某种疾病的病人中(分母) , 因此病而死人数(分子)的比例 。 问题是 , 这个定义并不直接涉及「一定时期」是多久 , 该定义最模糊的地方就在这里 。理想情况下 , 如果某种疾病发病痊愈或者致死时间都很快 , 我们在短期内就可以判断所有确诊病人的痊愈和死亡情况 , 从而得到一个较为准确的病死率估计 。 然而流行病的发生是一个不间断的过程 , 有新病例的出现 , 也有病程较长既未痊愈也未死亡的病人 , 在这个过程中如何估算病死率就是一个问题 。概念陷阱:病死率、R0和群体免疫|大象公会
再从分子和分母的角度看 。分母是已确诊的病人 , 在检测条件有限的情况下 , 这个数字一定是小于目前已感染人数的 , 其中重症病人的比例较高(这里暂时不考虑检测的假阴和假阳情况) 。 而像美国华盛顿州养老院感染这样的情况下 , 分母人群大多高龄有基础疾病 。 从这些角度看 , 目前估算的病死率可能高估了在更广泛人群中的病死率 。而另一方面 , 病死率的分子是已经确认死亡的人 , 由于某些人的病程较长 , 一些将死未死的人还没有被计入分子中 , 而如果数据发布方没有固定分母 , 不断加入新确诊人群进入分母 , 那么这个数字浮动也是有可能低估病死率的 。病死率在医院和医院之间 , 根据不同的接收病人情况、治疗方法、医疗水平、资源多寡等 , 都会有很大的差别 。同理 , 在评估一个国家的病死率的时候 , 一般都用总死亡数除以总确诊案例 , 也会出现以上提到的各种误差——检测能力、医疗水平、人口结构等 。检测能力强的国家(例如韩国)分母数值更接近于现实中的总感染数 , 而检测条件十分有限的国家 , 无法检测轻症患者 , 目前的确诊案例会远低于人群中的总感染数 。目前 , 所有的COVID-19相关统计数字 , 都与各个国家不同的检测能力和检测政策息息相关 , 低收入国家目前较少或极少的案例数 , 很可能是因为检测、死亡死因统计难度很大导致数据匮乏 。R0再来看R0(基本传染数-Basic reproduction number)——它的准确发音应该是R-naught 。R0是病原体传染性(contagiousness)强弱的一个指标 , 估算的是在传染病爆发初期(所有人都没有免疫的时候)一个有传染性的已感染者 , 平均可以直接传染多少人 。例如下图所示 , 灰色为感染者 , 白色为未感染病原体的易感者 , 以此估算 , R0大概就在2左右 。概念陷阱:病死率、R0和群体免疫|大象公会
· 图中R0大约为2我们为什么关心R0?因为当R0大于1的时候 , 传染病会迅速传播开 , 变得流行 ,如果不防控 , 就会指数增长;R0等于1的时候 , 传染病是地方性的(endemic) , 可控的 , 与人群长期存在;而只有R0小于1的时候 , 传染病才会因为无法传播开而逐渐消失 。R0目前的应用和估算的难度在于 , 它同时包含了对人类行为和病原体生物学特性的估计 。 对于任何一种传染病的病原体 , 如果做一下系统的文献综述 , 会发现R0的估算可能会有很大的差别 。R0基本上都是从模型中估算出来的 , 而每一个参数的估算都需要一定的假设 。 估算R0最常见的方法是估算以下三个主要参数并相乘:1、一个已感染者和易感者(即未感染者)每次接触传染病原体的概率(infection rate);2、一个已感染者感染之后有传染性的传播时长(contact duration);3、一个已感染者和易感者接触的频率(contact rate) 。概念陷阱:病死率、R0和群体免疫|大象公会
我们当然还可以根据病原体、宿主和环境的特性引入其它参数 , 增加模型的复杂性 。R0会随着抗疫政策、人群隔离行为等环境因素 , 在传染病流行的进程中发生变化 。 最容易影响的参数就是人与人的接触频率 , 会根据人口密度 , 社会组织类型、防疫政策等因素产生巨大变化 。从已有经验看 , COVID-19传染性较强 , 且可以无症状传染 , 这就增加了病原体的传播时长和人与人每次接触传染的概率 , 并且很难通过直接检测症状来隔离已感染者 。 因此 , 人们需要通过大范围的隔离 , 减少亲密接触来尽可能降低R0 。下图为研究者与伦敦卫生与热带医学学院传染病数学建模中心(CMMID)目前估算的世界各地区R0范围[1] , 只有把R0降到1左右甚至1以下的地区 , 才可能做到拉平曲线 , 减轻医疗系统的负担 。


推荐阅读