|蛋白质兼具可塑与稳定性?从进化视角揭示生命复杂系统的内在平衡( 四 )


从上面的讨论中我们可以看到 , 如果希望最大化一个系统的“功能敏感性” ,我们希望这个分子的振动谱中有大量集中在接近0的特征值;如果希望最大化一个系统的“突变稳定性” , 我们希望得到一个均匀的特征值分布 。 这两个优化的目标之间存在一定的矛盾 。 为了在这两个优化目标之间达成某种平衡 , 我们用熵最大化的方法 , 将功能敏感性作为一个约束条件(除此之外的约束条件还有归一化和系统的总能量或者说总连边数固定) , 最大化系统的突变稳定性(也可以反过来做) , 最终得到了一个幂律(power-law)的特征值分布 。 众所周知 , 幂律是临界现象的一个重要特征 , 这一结果从理论的角度证明了临界性对于蛋白质系统的重要意义 , 它不仅保证了蛋白质系统对于外界扰动的敏感性 , 也让蛋白质分子本身的进化变得更加稳定 。
|蛋白质兼具可塑与稳定性?从进化视角揭示生命复杂系统的内在平衡
本文插图

图4. 同时考虑蛋白质的功能敏感性(要求尽可能多的低频模式)和突变稳定性(要求特征值均匀分布)两个条件 , 将会得到幂律分布
4. 生物系统动力学中的低维特性
在上面的讨论中 , 我们以蛋白质这样一个具有多自由度的系统为例 , 讨论了其功能敏感性和突变稳定性之间的平衡关系 。 值得注意的是 , 当系统的自由度很低时 , “功能敏感性”和“突变稳定性”这二者之间根本就不存在矛盾 。
我们来看下面一个例子 , 这个例子也常常被用来描述机器学习系统的泛化问题[5] 。 如下图所示 , 图中的黑色实线代表着一个1维的能量面 , 在这个能量面上有两个能量极小值点(两个势阱) , 其中左边的一个比较陡峭(极小点附近曲率较大) , 另一个则比较平坦(极小点附近曲率较小) 。 当小球落在比较陡峭的势阱中时 , 如果给它一些扰动 , 小球的运动(涨落)是比较小的(如图中棕色虚线所示) , 而当小球落在比较平坦的势阱中时 , 给小球同样大小的扰动 , 那么它可以有比较大的涨落幅度 。 这里 , 我们所讨论的扰动都与能量面(系统)本身无关 , 这种扰动来自于系统以外 , 因此系统对扰动的敏感性体现为“功能敏感性” 。 另一方面 , 我们也可以考虑对系统(能量面)本身作扰动 , 例如对能量面作一个小小的平移(移动到浅蓝色的曲线) , 如果扰动前后 , 原势阱附近的能量变化很小 , 就说明在这个势阱附近 , 系统是突变稳定的 , 反之则是突变敏感的 。 如下图所示 , 陡峭的势阱经过平移 , 原先能量极小值点的能量增加了许多 , 是突变敏感的;而平缓的势阱在经过平移之后 , 能量的改变很小 , 因此是突变稳定的 。
|蛋白质兼具可塑与稳定性?从进化视角揭示生命复杂系统的内在平衡
本文插图

图5. 在低自由度的系统中 , 功能敏感性和突变稳定性二者是等价的
上面的这个例子如果用数学语言来说的话 , 系统对外界扰动的敏感性可以用势函数对变量(variable)的二阶导数(与我们前面提到的“曲率”相关)来描述;系统对内部扰动的稳定性性可以用势函数对参数(parameter)的二阶导数来描述 , 前者对应于势函数对变量的Hessian矩阵;后者对应于势函数对参数的Hessian矩阵 , 而它在统计学中对应于Fisher信息矩阵 , 这里我们不再延伸讨论 。 总之 , 综合以上的结果 , 我们发现 , 在这样一个低自由度的系统中 , 功能敏感性(系统对外界扰动的敏感性)与突变稳定性(系统对内部扰动的稳定性)是联系在一起的 , 甚至可以说是等价的(证明略) 。
我们也可以从上一节中所介绍的特征值的相关特性来说明这种等价性 。 我们考虑一个二能级系统 , 它本身的两个特征值为E1和E2 , E1≤E2 , 我们考虑固定这两个特征值的和 , 这相当于固定了系统的总能量(在弹性网络中对应于总边数 , 证明略) 。 如果要最大化这个系统的突变稳定性 , 正如之前讨论的 , 需要最大化这个系统两个值之间的距离 。 而如果要最大化系统的功能敏感性 , 我们则希望最小化其中较小的特征值 , 让它尽可能接近于0 , 这样该模式所对应的运动就可以被很小的扰动而激发 。 在这个仅有很小自由度的体系中 , 不管是最大化功能敏感性还是突变稳定性 , 我们都需要最大化特征值之间的距离 。


推荐阅读