生物信息学中的连锁分析与关联分析有哪些区别和联系( 二 )


单区间作图法(Interval Mapping,IM): 单区间作图法又叫双标记QTL 定位法, 它以一元回归模型和正态混合分布的极大似然函数为基础, 借助于分子标记连锁图谱, 计算基因组任一相邻标记之间的任一位置上存在QTL 和不存在QTL 的似然函数的比值的对数(LOD 值)。根据整个染色体上各点的LOD 值可以描绘出一个QTL 在染色体上存在与否的似然图谱。当LOD 值超过某一给定的临界值时, QTL 的可能位置可用LOD 支持区间表示出来。
复合区间作图法(Composite Interval Mapping,CIM), 复合区间作图法又叫多标记QTL 定位法。是一种基于全基因组的所有标记进行QTL 定位及效应分析的作图方法。CIM法以单区间作图法为基础, 利用多元线性回归分析的性质, 在假定不存在上位性效应的假设条件下, 将其他适当选取的标记考虑到模型中以控制遗传背景效应,提高作图精度,用类似于单区间作图方法, 计算各参数的LOD值及显著性, 绘制各染色体的似然图谱, 标出各QTL的可能位置。
混合线性模型(Mixed Linear Model,MLM) 混合线性模型是基于混合线性模型的复合区间作图法。为了估计QTL 之间的上位性及QTL 与环境的互作效应。该法用随机效应的预侧方法获得基因型效应及基因型×环境互作效应的预测值, 用单区间或复合区间作图的方法进行遗传主效应及基因型×环境互作效应的QTL定位分析。在该法中, 把群体均值、QTL的各项遗传主效应(包括加性、显性和上位性效应) 作为固定效应, 把环境效应、QTL与环境互作效应、分子标记效应及其与环境的互作效应,以及残差作为随机效应, 将效应估计与定位分析结合起来, 进行多环境下的联合QTL定位分析,提高了作图的精度和效率。MLM法可以避免所选的标记对QTL 效应分析的影响, 还能无偏地分析QTL与环境的互作效应,还可以扩展到分析具有加×加、加×显、显×显上位性的各项遗传主效应及其与环境互作效应的QTL, 具有很大的灵活性。
1.3.2关联分析
近年来,随着大量分子标记的开发以及生物信息学的迅猛发展, 应用关联分析方法发掘植物数量性状基因已成为目前国际植物基因组学研究的热点之一。关联分析具有以下优点:(1)不需要专门构建作图群体,自然群体或种质资源都可作为研究材料。(2)同时检测同一座位的多个等位基因。(3)较少的研究时间。(4)较高的精确性。
关联分析是以连锁不平衡(linkage disequilibrium, LD)为基础的,连锁不平衡是不同基因座位上等位基因的非随机组合。当位于某一座位的特定等位基因与同一条染色体另一座位的某一等位基因同时出现的几率大于群体中因随机分布而使两个等位基因同时出现的几率时, 就称这两个座位处于LD 状态。D 是衡量连锁不平衡的基本成分。若连锁的两个基因座位上的等位基因分别为A 、a 和B 、b ,它们组成的单倍型有AB 、Ab 、aB 和ab 共4 种, f(x)为各种等位基因和单倍型的频率, 当D =0 时, 两基因座位处于连锁平衡状态;当D ≠0 时, 两基因座位处于连锁不平衡状态。
D = f(AB)-f(A)f(B)
【生物信息学中的连锁分析与关联分析有哪些区别和联系】 LD 的度量方法有多种, 常用的有D\u0026#39;和r2 2种, 都是以D为基础的, 取值范围都是从0(连锁平衡)到1(连锁不平衡), 但它们表示的意义不同。D\u0026#39;是D 与D 最大可能值(当D \u0026lt;0 时为最小可能值)的比值 , 是一种与频率无关的度量。D\u0026#39;=1表示2 个座位间没有发生重组, 但等位基因频率不相同, 群体内只能同时出现3 种单倍型类型。此时D\u0026#39;反映了最近一次突变发生后突变位点与临近多态性位点的关系。 D\u0026#39;\u0026lt;1 表示两座位之间发生重组, 群体中可以同时观测到4 种单倍型。但是此时D\u0026#39;就很难清楚地解释群体内两基因座位之间的关系。r2 等于D2 除以两基因座各等位基因频率的乘积, 是一种与频率有关的度量。r2 =1表示两座位没有被重组分开, 且等位基因频率相同,群体内只能出现2 种单倍型。这时只观察一个座位即可提供另一座位的全部信息。故通过f(x)等位基因频率,度量LD,从而分析性状与标记之间的关系。


推荐阅读