热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能( 三 )


这是我们第 1 次有概念 , 我们的肠道、皮肤以及其它地方有多少不同的细菌 , 然后这些细菌的动态变化是什么 , 它们可能编码的基因又能做什么 , 以及对于我们的健康有可能产生一些什么样的影响等等 。
在那之后 , 他们又开展了第 2 期的微生物组计划 , 叫做 iHMP 。 样本量从原始的 300 多一直拓展了后面的将近 2000 人 , 然后每个人会有各种各样不同位置的微生物组数据 , 以及随着时间变化的数据 。 在这个里面 , 我们也初步看到了很多与疾病相关的一些微生物组的变化等等 。

热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

当然 , 除了这个项目之外 , 还有很多专门的针对不同疾病以及不同的人群所建设的微生物组的研究项目 。
比如说欧盟和中国华大以及另外的几个单位一起参与的 MetaHIT 项目 。 它是专门针对不同国家 2 型糖尿病患者与正常人菌群的不同 , 有很多非常著名、非常有影响力的研究成果在这里面被发现出来 , 比如说 enterotype 肠型这个概念 , 以及 mGWAS(微生物组的全基因组关联)等等 。
下面这个图是一个叫做 TwinsUK 的项目 , 在这里面所有的人都是双胞胎 , 有一些是同卵双胞胎 , 有一些是异卵双胞胎 。 这样的一个设置或者这样一个人群就提供了一个非常好的研究基因型对于微生物组以及其它性状影响的平台 。
我们知道同卵双胞胎和异卵双胞胎的生活环境基本上是一致的 , 但是他们的基因型在异卵双胞胎里面是 50%左右 , 而同卵双胞胎的话 , 他们的相似性是 100% 。 这样的话 , 一些性状如果真的是和基因密切相关的 , 我们能在这两类双胞胎中看出明显的不同 。
而且事实证明 , 在菌群方向 , 我们也确实看到了这两类的不同 , 从而确定了人类基因组对于微生物组明显的影响 。

热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

在 2016 年 , 我们的微生物组研究进入了大数据时代 , 真正的大人群时代 。
在这一期的 Science 上 ,包括我在博后时候的实验室以及荷兰的一个研究组各自发表了 1000 人以上的宏基因组数据 , 以及与各项生活习惯、用药、血常规 , 还有其它的一些全面的指标之间的关联性研究成果 。
在这里面 , 我们首次利用几百个指标去对应几百个不同的细菌成分 , 这样的研究真的只能在几千人以上的这种数据里面才能实现 。

热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

同样是 2016 年 , 11 月份的时候 Nature Genetics 也是以封面文章的形式发表了三篇这样的研究 。
在这里面 , 我们就初步探究了或者说初步建立了在人类基因组里面真正影响微生物组的突变位点以及变异的图谱 , 找到了非常多的和我们已知的一些疾病非常相关的一些位点 。 这样的话 , 我们就确定了微生物组在很多疾病中可能发挥的这种间接或者是直接的作用 。
【热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能】
热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

我们现在可以对于微生物组的这样一些变异 , 或者是人与人之间的不同做一些总结 。 我们知道一些主要的因素怎么样去影响微生物的不同 , 以及这些不同又反过来怎么影响人类健康 。
比如说刚才提过的我们人和人之间的这种肠型很有可能就是不一样的 , 它像我们的血型一样可以分成不同的型 。 这种型表现成细菌组成的不同 , 但同时也表现成疾病发病频率的不同 。
我们现在的研究基本上认为 , 这种肠型主要是我们的饮食决定的:长期饮食决定我们肠型 。 基因有一定的影响 , 但是比饮食要小一部分 。 反过来 , 我们现在也知道 , 由于饮食导致的微生物组的不同也会影响我们自身的这种健康 。


推荐阅读