新材料|大数据如何塑造材料科学家的新世界?( 二 )
本文图片
材料科学的发展新趋势:从“基于实验的经验型模式”向“基于数据的预测型模式”转变
国外如火如荼 , 国内也毫不逊色 。 2016年初 , 科技部正式发布“材料基因工程关键技术与支撑平台”的重点研发计划 , 很多大学和科研院所都搭建起具备材料计算和材料合成的设备 , 加入材料基因探索的浪潮 。 [1] 近年来 , 针对某些具体问题或性质的材料基因计算研究论文相继上线 , 国内对材料大数据的研究已初具规模 。
但是 , 与拥有大量基础的欧美相比 , 我国在材料计算方面有着全方位的差距 。 然而 , 新材料的研发与应用反映了一个国家的科技竞争能力 , 对国家安全和社会经济发展有着重大意义;只有全面、精确、规模化的材料数据库的建成 , 才有可能更有效地指导新材料的研发和突破 。 在这一点上 , 中科院物理所近期上线的“Atomly”数据库 , 一步到位地填补我国没有世界级材料数据库的空白 。
03
Atomly上线 ,
或是材料基因研究的下一块拼图
Atomly(https://atomly.net), 是中科院物理所最新原创的材料数据库 。 作为材料数据库中的“后起之秀” , 它不仅集各个前辈之大成 , 而且还在某些方面超越了它的前辈们 , 甚至实现了诸多创新功能 。 Atomly的特点如下:
本文图片
Atomly.net数据库上线 , 主界面如图所示(需注册)
1. “更多、更强”的数据
到目前为止 , Atomly已经计算了14万多种材料的相关数据 , 这些材料包含了经过数据库比对去重后的无机晶体结构数据库 (ICSD) 中的大部分结构 , 该数据库在实验合成及晶体研究领域久负盛名 , 也包含了一大批以往DFT计算研究中提出的假想结构 。 因此 , Atomly内含的材料数据不仅全面 , 而且和材料实验的联系十分紧密 。
本文图片
Atomly材料数据库目前的数据条目统计
在此基础上 , 我们得到了其中14万多种材料的详细电子结构信息(能带 , 态密度等)以及近4万组热力学相关的相图 。 这些数据可以让人们更深入地了解材料的相关性质 , 并能充分利用这些精度统一的信息去助力新材料的研发与探索 。
本文图片
Atomly数据库目前涵盖的信息
2. 个性化计算服务Run4U
材料数据库的用户们 , 物理背景往往并不相同 , 有些用户不熟悉第一性原理计算软件 , 或者想便捷的了解我们数据库中未包含结构的性质 。 因此 , 我们开发了Run4U这一功能 。 这一功能支持用户在线自主上传新的结构 , 我们的后台会对这些结构进行初步的筛选 , 如果数据库中真的没有包含 , 就会自动进行第一性原理计算 , 2-3天后用户便可在列表中看到想要的计算结果 。 使用Run4U功能时 , 用户无需购买软件、计算资源 , 也无需掌握学习DFT的计算细节;同时 , 计算的结果可以自动被后台分析入库 , 可复查、复用 。 Run4U的设计对用户非常友好 , 其流程如下图所示 。
本文图片
run4u , 用户提交结构并计算
3. 创新型材料设计方法
本文图片
“地毯式”全库材料搜索示意图
(1)通过高通量计算生产材料数据 , 进一步从数据出发搜索新材料 。 此类方法已有成功案例:过去70年人类平均每年发现3.3个氮化物材料 , 加州大学伯克利分校的Ceder组通过高通量计算等材料大数据方法 , 一年内发现92种有可能材料 , 并用实验合成7种 。 [7]
(2)机器学习势函数作为近年来迅速发展的学科 , 正在逐渐展示其优越性 。 在分子动力学中 , 对于传统势函数而言 , 往往缺乏一定的精度 , 这导致在时间步长的积累之下 , 势函数带来的“误差”将逐步积累 , 最终将给出一个错误的结果 。 而机器学习则可以利用DFT计算的数据进行拟合 , 得到的模型可在给定相应构型的情况下 , 预测出相应的物理属性 , 例如能量 , 力等 。 基于Atomly材料数据库内的大量数据 , 我们开发了一套精准的机器学习势函数工具包(Highly Accurate Artificial Intelligence Force Field, 简称HAAIFF) , 可以精确拟合分子动力学中所需的体系能量 , 原子受力等参量 。 在保证精准的前提下 , 我们对程序包进行了优化 , 使其可在GPU上进行训练以及预测 , 极大的提高了该机器学习势函数的速度 , 为运行分子动力学提供了便利 。 使用户同时获得密度泛函理论计算的精度和经典分子动力学的速度 。 该工具包可供用户进行自行使用 , 同时 , 为了节省用户收集DFT计算数据带来的成本 , 我们提供了由该工具包训练的机器学习势函数库 , 用户可在这些函数库的基础上 , 再次二度训练 , 以此既可以节省收集数据时间 , 又可以扩增机器学习势函数适用范围 。 以下为HAAIFF训练金属钨体系例子(含BCC和FCC的超胞结构 , 展示了HAAIFF高精度的特性) 。 我们将于不久的未来发布这一方法及程序包 。
推荐阅读
- 流感|流感如何应对?听听郑州市九院儿科主任杨平怎么说的
- 蠢萌新闻|《急先锋》成龙的“接棒”杨洋,年轻演员们表现如何?
- 观览天下|一块石头卖到十万,看村民们如何发家致富,你心动了吗?
- 乡村波比|野猪被禁止食用,农村野猪泛滥,糟蹋庄稼,该如何解决?
- 气象卫星|一文读懂风云气象卫星50年如何改变中国,未来两次发射“值得期待”
- 科学|世界3大未解之谜:生命起源、地球内核、宇宙之谜,该如何解释?
- Wind数据显|事关500万股民!2270亿洪峰将至,8只股票流通盘增逾3倍(附名单)
- 光速|如何超越光速?|No.227
- 比例尺|航天科工成功获取首幅1:2000比例尺雷达测绘数据
- 崇明|如何培养“小生态人”?揭开崇明推进生态教育的“学校密码”