人工智能,为科研注入智慧动能

【人工智能,为科研注入智慧动能】核心阅读
日前,科技部等六部门发文,着力打造若干重大场景,拓展人工智能应用,高水平科研活动是其中之一 。如今,我国人工智能技术快速发展,在数据获取、实验预测、结果分析等方面具有优势,生命科学、数学、化学、空间科学等学科研究纷纷拥抱人工智能 。丰富的应用场景也反哺技术发展,推动产业智慧升级 。
从日常生活到科学研究,如今,我国人工智能技术快速发展,数据和算力资源日益丰富 。应用需求是技术进步的重要推动力,新技术往往在“用”中不断完善、成熟 。为推动人工智能落地,日前,科技部等六部门联合印发了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,着力打造若干重大场景,拓展人工智能应用,高水平科研活动便是其中之一 。
作为赋能手段,人工智能如何带来新的研究方法,又如何为经济发展注入“智慧动能”?
融合紧密,助力科研更加高效、精准
诸多学科中,生命科学研究与人工智能融合较为紧密,其中一个热门方向是预测蛋白质结构 。
蛋白质具有三维结构,它的一级结构(序列)由多个氨基酸串联而成 。三维结构决定了蛋白质在细胞中的功能,许多疾病都是因体内重要的蛋白质结构异常而起 。因此,绘制出人体内重要蛋白质的“三维地图”,才能据此找到药物作用于人体的靶点,从而研制出精准有效的新药 。
传统上,科学家利用冷冻电镜、X射线、核磁共振等方法观测蛋白质三维结构,但这一过程耗时费力且花销不菲 。“以冷冻电镜为例,布置一个观测平台耗资数千万元,科研人员还要用很长时间才能绘制出蛋白质结构 。”百度飞桨螺旋桨生物计算平台负责人何径舟表示 。
由于难度高、实验周期长、成本高,通过传统方法观测到的蛋白质三维结构,至今数量非常有限 。相比之下,氨基酸测序容易得多 。为什么不能根据氨基酸序列来预测蛋白质的结构?早在1972年,美国生化学家克里斯蒂安·安芬森曾在诺贝尔奖的获奖感言中提出这一设想 。
从蛋白质的一级结构出发精准预测其三维结构,正是人工智能所擅长的 。然而,人类试图解析蛋白质组的工作进展缓慢 。据解释,这一方面因为现有的生物数据量小,质量不高,深度学习缺乏足够的样本;另一方面因为人工智能算法成熟也需要过程 。
近些年,随着生物数据剧增以及人工智能技术的优化,科学家建立起更精准的预测模型 。2020年12月,在一场比赛中,人工智能程序“阿尔法折叠”大放异彩,它预测的结果与大多数实验数据差不多 。这证明,预测蛋白质结构,人工智能已经相当精准 。
如今,借助人工智能,曾经可能耗时数年的工作,现在几分钟就能完成,还能解析传统方法不能观测到的一些蛋白质结构 。
据了解,利用人工智能,科研人员预测出了约100万个物种的超过2亿种蛋白质的结构,涵盖科学界已编录的几乎每一种蛋白质 。这将对结构生物学领域产生重大影响,可能引发生命科学研究的范式变革,并提升人类对生命的理解 。
前景广阔,在生命科学等多领域发挥作用
人工智能进入生命科学研究的视野,生物医药行业的需求是重要推动力 。据介绍,在生物制药行业,每投入10亿美元能够研发出的药物种类已不断下降 。新药研发难度越来越大,周期越来越长,急需新方法突围,人工智能被寄予厚望 。
不只是加速新药研发,人工智能正在生命科学越来越多领域发挥重要作用 。
今年初,国家超算成都中心运行的一个蛋白质预测模型,帮助四川农业大学农学院小麦研究所团队成功解析PGS1调控种子发育影响产量的分子机制,为培育高产高质小麦材料提供理论依据 。科研人员表示,如果没有人工智能,很难高效做出这一突破性成果 。
科研人员还尝试将人工智能技术引入疫苗设计中 。比如,相比于蛋白疫苗、DNA疫苗等,mRNA(信使核糖核酸)疫苗具有大规模生产快、抗感染性好等优势,但稳定性和免疫原性相对较差 。补上这些短板,科研人员一直希望通过优化mRNA疫苗序列设计,使其更稳定,免疫原性更强 。更高效、成本更低,人工智能的介入有望为疫苗研发提供新思路 。
精准治疗也是人工智能应用的舞台 。通过机器学习的方法,理论上,人工智能可以解码人体免疫系统,更精准地探寻到一些疾病的复杂免疫规律,从而帮助人们理解疾病,更高效率、更有针对性地开发治疗药物和方法 。


推荐阅读