汉族最大规模！中国人基因库研究首发，日本与中国北方汉族人群聚类完全重叠 |基因组|Fst|基因

北京联盟_本文原题：最大规模！中国人基因库研究首发，日本与中国北方汉族人群聚类完全重叠
生、长、衰、病、老、死，一切都与基因有关。不同地域和民族的人，其基因也千差万别。
鉴于此，最大规模的中国人基因库研究结果于近日首次发表——上海交通大学医学院附属瑞金医院内分泌科联合全国 29 家研究机构、医院，首次公布了来自 27 个省、直辖市 8 个民族的 1 万余人的高深度全基因组测序数据及表型的系统性分析结果。
2020 年 4 月 30 日，上述团队题为 The ChinaMAP analytics of deep whole genome sequences in 10,588 individuals（中国代谢解析计划对 10588 例样本的深层全基因组序列的分析）的论文发表于由中国科学院主管的国际性学术月刊《Cell Research》（细胞研究）。

本文插图

中国代谢解析计划
糖尿病、骨质疏松、低血糖、痛风，这些病症我们已经不陌生了。
本质上，它们都属于「代谢性疾病」。
顾名思义，这是一种因代谢问题引起的疾病。作为世界范围内最常见、发展最迅速的健康问题，代谢性疾病在很大程度上决定着人类的死亡率，也正在成为一项日益严重的公共卫生挑战。
世界上没有完全相同的两片树叶，而同一种疾病背后也存在个体差异。想要更好地进行个体风险评估、提升预防、治疗代谢性疾病的效果，关键在于了解代谢性状的遗传结构。
实际上，最简单粗暴的方法就是对大规模人群进行全面的遗传分析。
如今，基因库的概念已经并不稀奇了，欧美已经有了一些出名的人类基因组学和生物信息学数据库，比如英国生物样本库（UKbiobank）、基因组聚集数据库（gnomAD）、千人基因组计划（1KGP）、UK 10K 计划、dbSNP 和多组学精准医学研究计划（TOPMed）。
考虑到东亚人和欧洲人在遗传背景和种群特征方面存在的巨大差异，一项「中国代谢解析计划」（China Metabolic Analytics Project ， ChinaMAP）应运而生。
根据上海交通大学医学院附属瑞金医院公众号介绍，该医院此前牵头开展了多项覆盖全国的队列研究，基于相关研究，国家代谢性疾病临床医学研究中心（上海）依托了转化医学国家重大科技基础设施（上海）和医学基因组学国家重点实验室，实施了这一计划。
ChinaMAP 旨在全面囊括汉族及主要少数民族在不同地理区域的多样化遗传结构，并调查其对代谢疾病的影响以及广泛的生物医学相关的定量特征。
ChinaMAP 基于三个大型队列：

2010 年中国非传染性疾病监测：全国范围内 15 万名参与者的研究；
中国糖尿病患者癌症风险评估：25 万名参与者的研究；
上海城市化进程中的社区心血管风险：5 万名参与者的研究。

10588 位参与者的全基因组测序深度数据在 ChinaMAP 一期阶段，研究团队 27 个省的 8 个民族（汉族，回族，满族，苗族，蒙古族，彝族，藏族和壮族）中随机选择参与者，毫无偏倚的选择、过滤，进行了 10588 位参与者的全基因组测序深度数据，最终完成了中国人群遗传变异数据构建、中国人群体结构分析、基因组特征比较，及变异频谱和致病性变异解析。
其中，平均基线年龄为 54 岁，女性占比为 64.8％。
另外雷锋网了解到，基因在特定的位点上， DNA 序列存在差异，也就是说，基因组中散在的碱基不同，比如点突变、单个碱基的置换、缺失和插入，这实际上也就是基因多态性的一种表现，这在生物学上被称为 SNP ，即 single nucleotide polymorphism ，即单核苷酸多态性。
而在 ChinaMAP 一期数据库中，共有 1.36 亿个 SNP 和 1000 万个插入或缺失位点，其中一半都属于多个国际通用的数据库中没有的新位点。