热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能( 五 )



热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

我们怎样去做这样一些事情 , 怎么样把它整合成大数据 , 然后去研究呢?
我们就需要 BioBank, 需要这种生物的样本库 , 需要进行非常系列的长期追踪 , 包括刚才说的从孕期 , 甚至孕前开始追踪一系列的人群 , 然后不停地收取各种各样的样本 。
通过不断积累数据 , 通过这些数据有针对性的分析 , 我们才能够发现越来越多需要去关注的因素 , 这需要非常大的一些投入 , 而且很多时候 , 也是比较耗时间的 , 但是这些事情真的是需要做 。

热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

我们刚才说了 , 过去 10 年、20 年生物医学的进展特别得益于第二代测序技术 , 就是 NGS 技术的发展 。 现在我们非常有幸迎来了 TGS , 就是第三代测序技术 , 也就是迎来了单分子实时荧光测序技术的发展和兴起 。
其中一个代表就是英国牛津纳米孔公司所研发的 ONT 系统 。 这种检测平台可以实现 DNA 或者 RNA 分子更长的直接测序 , 还能够在一些 DNA 或者是 RNA 分子上看到它们的一些修饰的信息 , 所以我们能看到更多组学 。

热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

我们自己工作组在过去的时间里面发展了一个叫做 Tri-Ome-Seq 的测序技术 , 它可以实现宏基因组、宏转录组 , 以及宏甲基化组的同时检测 。 我们现在已经在很多的人群里面进行这种全面的大数据的积累和分析 。

热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

同时 , 我们利用这个技术已经开始解析人的病毒组 , 尤其是肠道病毒组 。
我们在过去的一段时间里面 , 对于病毒组是相对比较忽略的 , 但是一些基础性的研究 , 一些前沿性研究已经表明 , 尤其是在婴幼儿里面 , 病毒组的发生发展与健康是息息相关的 。
同时 , 在成人里面 , 我们也知道很多疾病的发生 , 不光有微生物组的变化 , 不光有微生物组的失调 , 他们的病毒组也发生了非常明显的变化 。
我们工作组最近发表的文章就是利用宏基因组病毒组的这种提取富集技术 , 结合三代测序进行了全基因组的测序以及拼接工作 。 利用三代测序我们能够获得很多病毒的全基因组 , 而且是直接获得 , 不需要之前的特别复杂那种拼装 。 这样的话节省了很多的计算 , 也节省了很多时间 , 有助于我们进行非常多的且深入的病毒组学研究 。

热心肠先生|王军:25分钟漫谈菌群研究中的大数据和人工智能
本文插图

最后 , 除了“大数据”这样一个比较炫的名词 , 大家很有可能也每天都被“人工智能”这样一个关键词所轰炸 。
真正的人工智能现在发展前景非常广阔 。 但是我们所谓的这种比较宽泛的、能够自我思考的这种人工智能 , 就是在电影 Terminator 里面所描述的那种 , 现在还是非常难实现的 , 甚至有一些专家认为是基本上不可能实现的 。
现在人工智能真正应用的领域都比较窄 , 是用来解决特殊问题的 。 所以有的人也非常有意思地称他们是“人工智障” 。 也就是说 , 我想要一个人工智能的算法 , 或者一个人工智能程序去做一件事情 , 它就做不了其它 。 对于人工智能这些算法 , 我们很多时候需要针对一个问题进行一次编程 , 针对另外一个问题这一套算法就完全失效了 。
比如右边我去训练一个算法去判断一个动物是狗 , 还是猫 。 你可以让电脑训练非常好的算法 , 能够把狗和猫分得特别清楚、特别快 , 但是这样一个程序不能去做其它的 , 比如炒菜或者买菜这样的一些工作 , 所以这就是现在这种比较狭义的人工智能的一些限制 。


推荐阅读