现有的基因序列方面的证据还不能证明病毒源自西方( 三 )

《科技日报》也于3月8日发表题为《冠状病毒变异成两个‘亚型’?并非实锤!》的报道 , 报道援引专家观点指出 , “亚型”有独特的意义 , 不同病毒的定义不一样 , 不是只要有一两个突变就可以分出“亚型” 。 根据对病毒现有的认知 , 病毒的变异速率大约为每年1000个碱基中发生1个碱基的变化 , 只有在关键位点的变化才能导向突出的变异 。 “目前看 , 这个程度的变异造成的差异不足以叫‘亚型’ , 叫分枝(clade)比较合适 。 ”爱丁堡大学分子进化学教授安德鲁·兰巴特(Andrew Rambaut)也在其个人社交平台上就3月3日论文研究结果发表了评论 , 他指出 , 新冠病毒的基因组有大约3万个碱基对 , 平均每个月会累积出1-2个新的突变 , 这个速度比流感病毒慢2-4倍 。 利用这些细微的变化 , 研究人员可以绘制出病毒的谱系树 , “观察进化树 , 发现了所定义的两个谱系是由不同的突变定义的 , 那是因为这个进化树就是用不同的突变构建的 , 每个分支都是由它们定义的 。 ”“3月3日论文”的通讯作者、北京大学生命科学学院生物信息中心研究员陆剑在virological网站上回复格拉斯哥大学研究团队的质疑时表示 , 对于进化遗传学家而言 , “功能性”测试就是种群中每个突变的频率 。 如果某个突变具有适应性优势(或传播优势) , 它将比中性参考更为普遍 。 在发表的研究中 , 研究者使用的是不改变蛋白质序列的同义突变作为中性参考 。3月3日论文发表后 , 3月5日 , 预印本平台medRxiv也发表了浙江大学农业与生物技术学院和中山大学中山医学院等研究人员撰写的论文《新冠病毒的基因组变异表明存在多个暴发传播源》 。 该文在新冠病毒分型的结果上得出了与3月3日论文相同的结论 , 研究团队检查了169个SARS-CoV-2的基因组 , 发现它们可以分为两种主要的基因型:I型和II型 , II型可能是从I型进化而来;研究推测II型菌株比I型更具传染性 。该论文一位作者就两个位点的突变“作为分型标准是否充分”的问题回复财新采访人员称 , 他们认为以这两个突变位点定义病毒的分型 , 理据是充分的 , 位点是看病毒有没有变异以及不同病毒有没有差异最直接的证据 。样本偏差关于“3月3日论文”中 , L型新冠病毒在所有样本中的数量占比远高于S型 , 多名科学家也指出 , 这完全可能是偶然事件 , 由于样本量太少 , 尚无法得出相关定论 。兰巴特在其个人社交平台上指出 , “病毒系统发生学的第一条规则:如果病毒的传播特性看起来不同 , 99%的情况是因为流行病学的关系” 。 他认为 , 仅仅是病毒输出并在别处导致大暴发 , 并不代表病毒行为发生了改变;某个病毒株系比其他株系更庞大 , 完全可能是偶然事件 。麦克林向“财新”采访人员表示 , 目前在进化树上呈现出的各个样本和观察到的突变频率 , 受很多因素影响 。 而这些影响会带来比较明显的样本偏差 , 基于这一基础得出的关于分型的结论以及不同“亚型”传播速率之间差异的推测或存在缺陷(flaw) 。 此外 , 对疫情期间病毒传播速率的推测 , 必须要充分考虑流行病学特征 。他表示 , 在病毒暴发过程中 , 每一个传播事件都是随机的概率事件 。 有一些感染者会传播给更多的人 , 有一些感染者则传播得更少 。 除了可能与病毒本身的特征有关 , 更有可能是其他各种原因导致的 , 比如有些人用手捂住嘴咳嗽 , 有些人则乘坐了拥挤的公交 , 还有些传播情况的出现仅仅是因为感染者的密切接触者运气好 。 随着时间的推移 , 这些小规模的各不相同的流行病现象累积起来 , 形成了暴发期间人们从公开信息建立起的进化树上观察到的突变频率变化 。麦克林介绍 , 病毒暴发的早期会出现“奠基者效应”(founder effect) , 造成进一步的观察偏差 。 当病毒最开始传播到未受感染的新地区或国家时 , 少量的病毒毒株会迅速传播流行起来 , 因此在感染初期任何突变都会迅速变得非常普遍 。 这种情况尤其可能在新冠病毒疫情中发生 , 因为这一病毒的易感人群太多了 。 “奠基者效应”在已有的多项病毒暴发发研究中均有所描述 。到了疫情后期 , 进化方面的理论认为 , 感染了不同类型病毒的感染者会在当地的一大群人之间自由传播 , “奠基者效应”引发的随机影响就会变弱 。 此时各地的病毒相对独立 , 流行环境相对固定 , 种群内病毒的演化也相对封闭而更少受外界影响 , 理论上对病毒就形成了一种主要受病毒学影响而不受流行病学影响的演化环境 。但麦克林向财新采访人员表示 , 至少到目前为止 , 明显还不能把全球各地的病毒都当作单一种群来看待 , 而更像是全球存在多个独立的种群 , 病毒在种群之间迁移率很低 。 比如 , 今天在美国华盛顿州的人被华盛顿州的新冠病毒感染的概率 , 要大于被意大利的新冠病毒感染的概率 。 在当下这个阶段 , 所谓的“瓶颈效应”就会显现 , 这些流行病学因素 , 仍将影响人们观察到的病毒的突变频率 , 从而严重影响科学家们对各种突变频率的简单估计 。取样和基因组测序也是进化树上呈现出的突变频率的重要影响因素 。 如果将全球共享禽流感数据倡议组织数据库GISAID上公开的样本与世界范围内观察到的感染进行比较 , 有些国家对感染者进行测序的比例远远高于其他国家 , 这就导致纳入谱系树的样本存在偏差 。 在样本容量上 , 截止2020年3月10日 , 全球已经有近12万人感染了新冠病毒 , 而公开资料只有超过200例全基因组序列 , 仅占所有病例极小极小的一部分 , 而且其间只有很少的显著的序列差异 。“目前这样分析解读新冠病毒的基因序列很容易造成过度解读 。 ”麦克林说 。美国加州大学圣地亚戈分校医学中心


推荐阅读