中国科学院 北京基因组所开发出基于深度学习的单细胞转录组分析模型

单细胞转录组作为单个细胞的特征 , 可更加精确地定义细胞的类型 。 常规的基于单细胞转录组的分类方法首先是进行无监督的聚类 , 然后根据每个集群(Cluster)特异表达的细胞标记基因来对集群进行标注 。 虽然基于无监督的分类方法更容易发现新细胞类型 , 但是人工标注的过程费时费力 。 目前已有的基于监督学习的自动分类方法 , 大部分无法兼顾到方法的可解释性以及新细胞类型的发现 。
【中国科学院 北京基因组所开发出基于深度学习的单细胞转录组分析模型】近日 , 中国科学院北京基因组研究所(国家生物信息中心)研究员蔡军研究组、北京师范大学教授张江研究组合作在NatureMachineIntelligence发表了题为Aninterpretabledeep-learningarchitectureofcapsulenetworksforidentifyingcell-typegeneexpressionprogramsfromsingle-cellRNA-sequencingdata的研究成果 , 构建出决策过程可解释的深度学习网络模型 , 单细胞胶囊网络(singlecellCapsuleNetwork,scCapsNet) , 并用于单细胞转录组分析 。 相对于其他单细胞转录组自动分析工具 , 单细胞胶囊网络能更稳定更高效地分辨出属于新细胞类型的细胞 。 同时 , 单细胞胶囊网络能通过模型的内部参数找出细胞类型相关基因 。 通过细胞类型相关基因 , 单细胞胶囊网络能将基因与细胞类型直接联系起来 , 提高了深度学习模型的可解释性 。 本质上 , 单细胞胶囊网络将基因的表达特征和细胞类型特征进行低维编码 , 这样的编码富含生物学意义 。
蔡军与张江为论文共同通讯作者 。 北京基因组所博士王力飞为论文第一作者 。 研究工作得到科技部重点研发项目、中科院战略性先导科技专项、国家自然科学基金委员会等的资助 。
中国科学院 北京基因组所开发出基于深度学习的单细胞转录组分析模型
文章图片
单细胞胶囊网络的结构以及模型的可解释性(细胞类型相关基因的发现)


    推荐阅读