助攻■对抗病毒,AI上场“算”结构 是否“神助攻”仍需实验验证

助攻■对抗病毒,AI上场“算”结构 是否“神助攻”仍需实验验证
文章图片

此次AlphaFold对新冠病毒蛋白质结构的预测 , 是脱离于实验之外的结构重构 。 预测的准确性 , 尚需同行评审 , 以及实际临床治疗的验证 。
蛋白质是维持生命所必需的结构复杂的生物大分子 , 人体内几乎所有的功能如肌肉收缩、呼吸 , 或将食物转化为能量等 , 都与蛋白质之间的相互作用密切相关 。 而获得蛋白质三维结构 , 则有助于科学家了解它在人体内的作用 , 并设计相应的药物 。
近日 , 人工智能公司DeepMind宣布 , 其用AlphaFold预测了六种由新冠病毒基因编码的蛋白质的三维结构 , 包括膜蛋白、非结构蛋白等 , 而且已经开放下载 。
获悉病毒蛋白质结构 有助于研发针对性药物
病毒由核酸和蛋白质组成 , 而蛋白质是由病毒基因组编码的 。 病毒蛋白质有两种 , 一种是结构蛋白 , 它们可以构成一个形态成熟的有感染性的病毒颗粒 , 帮助病毒侵染细胞 , 例如壳体蛋白、膜糖蛋白和存在于病毒颗粒中的酶等;另一种是非结构蛋白 , 则帮助病毒在宿主细胞里复制、基因表达 , 扩大在人体内的领地 。
早在1月10日 , 中国公布新冠病毒全基因组序列 。 但仅仅知道基因组序列 , 并不能充分了解蛋白质是如何工作的 。
蛋白质的成分包括20种氨基酸 , 每个蛋白质由几十到上千个氨基酸组成 。 部分氨基酸的线性序列会形成螺旋或者折叠状的二级结构 , 并进一步有序组合堆积成三维结构 , 这种三维结构决定了蛋白质在人体内如何发挥作用 。 中国药科大学药学院教授肖易倍接受科技日报采访人员采访时 , 打了个比方 , 如果说人体的病毒受体是锁 , 病毒的刺突糖蛋白就是钥匙 , 如果这些钥匙能插进人体病毒受体蛋白 , 就会侵染细胞 , 科学家要做的 , 就是弄清楚钥匙内的三维结构是什么、钥匙和锁的关系是什么 , 进而阻止钥匙去开锁 , 即阻止病毒侵染细胞 。
知道了蛋白质如何发挥功能 , 就知道如何有针对性地抑制病毒活性 , 如果发现某个蛋白是入侵宿主细胞的关键蛋白 , 就可以针对这个蛋白或者蛋白的某个区域做药物设计 。 南京大学生命科学学院教授、博导董咸池说 。
预测结果即使准确 实验过程仍不可回避
在DeepMind团队看来 , 可根据氨基酸序列确定蛋白质的三维结构 。 他们基于深度神经网络 , 通过预测蛋白质中每对氨基酸之间的距离 , 以及连接这些氨基酸的化学键之间的角度 , 使用两种方法 , 来构建预测模型 。
第一步是在结构生物学常用的技术上 , 训练神经网络预测蛋白质中每对氨基酸之间的距离或角度 , 然后不断组合这些概率 , 提高蛋白质结构预测的准确度;第二步是通过梯度下降来优化得分 。 他们预测的是整个蛋白质链 , 而不是蛋白质结构组装之前的蛋白质‘碎片’ , 因此一定程度上降低了整个预测过程的复杂性 。 湖南大学超算中心副主任、教授彭绍亮告诉科技日报采访人员 , AlphaFold从头开始对蛋白质的形态结构进行建模 , 而没有使用已经解析的蛋白质作为模板 , 这意味着需要超大的计算量 。
而据清华大学自动化系生物信息学副教授汪小介绍 , 在目前国际的蛋白质数据库(PDB)中 , 有大约3万种已知的蛋白质结构 , 利用其中与目标序列具有相似性的蛋白质序列 , 可以为蛋白质结构预测提供支持 。
在人工智能深度学习之外 , 科学家们想要获取蛋白质结构 , 目前大多从核磁共振、冷冻电镜与X射线衍射技术中寻求答案 。
三种方法都依赖大型设施、仪器 , 实验手段获得的蛋白质结构 , 通俗地说就是给蛋白质多角度拍照片 , 然后根据海量二维照片重构三维结构 , 结果客观精确 , 但是实验周期比较长 , 通常需要几个月 , 实验门槛和实验成本高 , 实验难度也不小 。 彭绍亮说 。


推荐阅读