|蛋白质兼具可塑与稳定性?从进化视角揭示生命复杂系统的内在平衡( 三 )


3. 定量分析和讨论
下面 , 我将简单介绍一下我们对蛋白质系统的功能敏感性和突变稳定性的定量描述 。 因为这个工作的主要目的是为了建构关于蛋白质“基因型—表现型”的理论 , 为简单起见 , 我们这里仅考虑蛋白质的天然态动力学 。 此时 , 我们可以将蛋白质的运动简化为天然态(能量最低结构)附近的振动 。 在实践中 , 可以用弹性网络模型(elastic network model)来描述蛋白质的天然态动力学[4] , 在这种模型中 , 构成蛋白质的基本单元(氨基酸残基)被描述为一系列的小球 , 这些小球之间由弹簧连接 , 连接关系由蛋白质的天然态结构决定 。 这样 , 蛋白质的振动问题就变成了力学中的一个经典问题 , 即求解耦合振子的振动模式 , 这个问题也与结构化学中求解分子的振动模式、或者固体物理中求解晶体中的格波是类似的 。 注意到弹性网络模型是一个线性模型 , 而弹性网络的拓扑结构可以由该网络的拉普拉斯矩阵(graph Laplacian)描述 , 该 Laplacian的特征值(eigenvalue)正比相应振动模式的频率的平方 , 而与这些特征值相对应的特征向量(eigenvector)则描述了相应振动模式的基本形态 。
|蛋白质兼具可塑与稳定性?从进化视角揭示生命复杂系统的内在平衡
本文插图

【|蛋白质兼具可塑与稳定性?从进化视角揭示生命复杂系统的内在平衡】图2. 蛋白质的天然态结构(左)与其所对应的弹性网络模型(右)示意图
有了这样一个模型框架 , 我们就可以来定量刻画“功能敏感性”和“突变稳定性” 。 在本文中 , 我希望不用公式 , 介绍相关定义的基本思路 。
|蛋白质兼具可塑与稳定性?从进化视角揭示生命复杂系统的内在平衡
本文插图

图3. 蛋白质的功能敏感性(A)与突变稳定性(B)的定义示意图
如前所述 , 功能敏感性描述的是系统在外界扰动下的响应情况 。 根据这个定义 , 很容易想到 , 在相同的噪声情况下 , 结构涨落越大的分子功能敏感性越高 , 而这个涨落的大小可以用蛋白质的构象熵(conformation entropy)来描述 , 熵越大 , 可能的结构数也就越多 。 经过数学推导 , 可以发现 , 这个熵与振动谱中振动频率(特征值)的乘积的对数有关 。 当所有频率的乘积越小时 , 系统的熵越大 , 这个结果有很直观的意义 。 一方面 , 这个乘积可以看成是高维空间中的一个椭球 , 椭球的大小即为构象空间的体积;另一方面 , 这一结果也有很直观的物理意义 , 如果一个系统有大量低频的模式 , 那么很小的能量就能激发出系统大振幅的运动 。 当我们希望最大化一个蛋白质分子的构象熵时 , 我们实际上是希望这个分子有尽可能多的低频的振动模式 。 换句话说 , 我们希望这个分子的振动谱中有大量集中在接近0的特征值 。
接着 , 我们来考虑定量刻画一个分子的“突变稳定性” 。 而我们在这里所考虑的“突变” , 是对系统内部的扰动 , 换句话说 , 是要对网络的拓扑做些改变 , 看看经过这一改变 , 系统的动力学到底发生了些什么变化 。 前面提到 , 特征值相对应的特征向量描述了与功能相关的振动模式的基本形态 , 如果在突变前后 , 相应的特征向量没有发生太大的改变 , 则说明这个系统具有较高的突变稳定性 , 而如果网络结构的变化特征向量发生了巨大的改变 , 则说明系统对突变是敏感的 。 怎样定量刻画这种稳定性或敏感性呢?根据微扰论(或根据Davis-Kahan定理) , 可以证明 , 第i个特征向量的突变稳定性与它所对应的特征值(λi)及其近邻的特征值(λi-1和λi+1)之间的距离(gap)有关 , 如果要最大化第i个特征向量的稳定性 , 那么我们需要最大化λi和它相邻的特征值之间的距离 。 如果我们希望让所有的特征向量都尽可能稳定 , 那么我们需要让振动谱中 , 各个特征值与它的近邻值之间的最小距离最大化 。 而要最大化这个最小距离 , 我们所期待的是一个均匀的特征值分布 。


推荐阅读