以“大数据+AI”为标志的数据驱动,已成为材料科学发展的第四范式-600学习网
600学习网终身会员188,所有资源无秘无压缩-购买会员
材料创新一直是各种颠覆姓技术革命的核心,因此材料常常成为时代的象征。
传统的材料研发模式往往依赖于实验和”试错”方法。研发过程通常持续10-20年。所需工作量巨大,在很大程度上,它无法满足21世纪工业发展对新材料的需求。随着材料模拟领域信息技术的发展,高通量计算系统可以在短时间内获得大量数据,并利用人工智能筛选和设计新材料,从而大大提高材料研发速度,降低材料研发成本。
图1:材料科学阶段示意图
材料的发展可分为四个阶段。第一阶段是实验驱动:基于实验和”试错”。第二阶段是理论驱动:随着各个领域研究的深入,材料科学的理论研究趋于成熟。特别是分子动力学和热力学模型的应用为材料研究提供了很多帮助,提高了新材料研究的效率。第三阶段是计算驱动:计算机的应用使材料科学的研究进入了计算模拟阶段。基于理论计算和模拟,预测有前途的候选材料,缩小实验范围,最后通过实验进行验证,从而大大提高材料科学的研究效率。
数据驱动被认为是材料科学的”第四范式”
基于信息技术和数据科学,材料信息学通过大数据和机器学习提取数据之间的隐藏变量,并建立模型来指导材料科学的发现。中国科学院院士.清华大学前校长顾认为,人工智能的发展缩短了材料研发周期,减少了投资,加快了整个领域的进程。因此,材料科学和人工智能的协同发展无疑将在材料科学中发挥关键作用,这有望促进新材料的发现。
人工智能技术已广泛应用于生物.医学.工业等领域
人工智能快速发展的动力在于计算能力的进步。计算能力的进步使产生和处理海量数据成为可能,从而使人工智能渗透到各行各业。
2020年12月,《自然》杂志报道说,波兰科学院的Bartosz Grzybowski和其他研究人员宣布,化学软件”Chematica”已得到改进,可以为复杂的天然产品设计一条完整的合成路线。这个程序设计的路线与人类设计的路线几乎相同,并且已经通过了化学版的”图灵测试”。
2021 7月,DeepMind宣布AplhaFold2成功预测了98.5%的人类蛋白质结构。在数据集中预测的所有氨基酸残基中,58%达到可信水平,其中35.7%达到高置信水平。在此之前,科学家花费了几十年的努力,只覆盖了人类蛋白质序列中17%的氨基酸残基。
机器学习已被证明在加速材料开发方面是有效的
机器学习方法在材料设计和材料筛选方面显示出巨大的潜力,有望极大地促进新材料的发现。2020年,NPJ计算材料杂志发表了美国桑迪亚国家实验室的研究成果,记录了他们开发的机器学习算法。该算法可以执行比正常速度快近40000倍的材料模拟计算。
2016年5月,《自然》杂志发表了一篇文章,通过机器学习和预测新材料,从过去被视为”失败”的数据中”学习”规则。与经验丰富的化学家的人工判断相比,机器预测结果的成功率为89%:78%。这个案例充分展示了机器学习方法的威力,就像Alpha Go对Go的影响一样。
机器学习不仅可以预测木材的姓质,而且可以挖掘边界条件等信息,这有助于促进对相关机制的理解。Gerbrand Ceder教授的a组
600学习网 » 以“大数据+AI”为标志的数据驱动,已成为材料科学发展的第四范式-600学习网