ZHANGHui-ran,HURui,LIUXi,LISheng-zhou,ZHANGGuang-jie,QIANQuan,DINGGuang-tai,DAIDong-bo.Anend-to-endmachinelearningframeworkexploringphaseformationforhighentropyalloys[J].TransactionsofNonferrousMetalsSocietyofChina,2023,33(07):2110-2120.
研究背景
在高熵合金(HEAs)中,相的选择通常依赖热力学参数,许多研究探寻不同的热力学参数对合金相形成规律的影响,然而,从众多参数中找到合金相形成的条件参数,以指导合金设计,仍然是一个相当困难的任务。
近年来,许多研究人员将机器学习(ML)应用于预测高熵合金的相形成,但大部分ML模型都是黑盒模型,缺乏可解释性,无法从模型中获得新的化学知识。在进行模型构建的时候,参数或特征有助于阐明合金的相形成规则,而在缺乏领域知识的情况下,如何通过特征工程或模型来筛选材料描述符是一个关键问题。
(1)当原子尺寸差
大于8.295%,单相固溶体的形成往往受到抑制,同时验证了Hume-Rothery规则。
(2)价电子浓度VEC不仅影响二元合金金属相的稳定性,而且影响HEAs中不同固溶体相的形成。
(3)
和“熵”指标是区分单相和多相的重要特征。
图文解析
图1基于机器学习的HEAs相位预测工作流程图
在现有经验参数和ML模型的基础上,分别建立了材料描述符池和ML模型池。然后,评估拟合所有描述符的所有ML模型,将高于平均特征重要性的特征保留,得到特征子集,并根据分类指标如准确率(A)、kappa指数(k)、F1分数(F)、混淆矩阵等选出最合适的模型。
图2HEAs五相数据比例图
数据集共430条数据,所有合金根据其微观结构分为5类:FCC(面心立方)、BCC(体心立方)、HCP(六边形密排)、MP(多相)和AP(非晶相)。数据集的每个数据由14个经验参数和合金的相结构组成。数据集包含100个单相固溶体(48个FCC,43个BCC和16个HCP),237个多相固溶体和63个非晶相固溶体。
图38个模型的特征重要性得分图
不同模型得到的特征重要度差异较大。对于SVM来说,
和VEC是比较重要的特征。在使用DT构建HEAs相分类模型时
VEC和
作为树中的节点,作为最重要的特征最大程度地划分不同相类别的数据。在上图中,每个子图的红线表示特征的平均值,所有超过阈值(红线)的特征都被保留下来。然后,利用这些特征子集建立相分类模型。
图48个ML模型的准确率以及每个模型使用的特征集
从模型的三个指标的结果来看,基于树的ML模型(DT、RF和ExtraTree)优于其他五种模型。特别是在训练集上,三种基于树的模型都能准确地拟合训练数据集,并且在验证测试数据集上的性能均具有较高的准确率(均在80%以上),说明基于模型选择的特征子集在模型的拟合能力和泛化能力方面都有较好的表现。
令人惊讶的是,只有四个特征的DT模型(
VEC,
)优于其他两个集合树模型(RF和ExtraTree)。这表明HEAs相的形成受这四个因素的影响。因此,选择具有四个特征的DT作为最终合适的相位预测模型。
图5HEAs相预测模型试验结果的混淆矩阵
在混淆矩阵中,有几种单相合金被错误地归类为多相合金,这是因为基本成分的变化或外部因素可能导致结构的不同。如在AlxCrCuFeNi2合金中,随着铝元素摩尔分数的增加,结构会由FCC单相转变为FCC+BCC多相。在HfNbTiZr耐火高熵合金中,其晶体结构与不同温度退火后的晶体结构不同,较低温度下出现BCC+HCP混合相。
此外,从上图可以看出,少量多相HEAs被错误地归类为单相合金,而多相中确实存在这种被识别的单相,原因可能是由相的比例:一些多相HEAs和单相HEAs可能被DT模型错误地分类在一起,这些混合相中的单相占据了晶粒内部的大部分,而其他的单相往往只在枝晶间区域形成,如CrCu2Fe2MnNi2等。此外,HEAs的相形成对温度敏感。随着温度的降低,固溶体发生相分离,使构型熵减小。而熵的减小可以增大金属间化合物的成核驱动力。
图65种相HEAs数据集二维
VEC分布可视化图
错误分类的HEAs主要出现在三个区域(蓝色和灰色圈出的区域),这些区域包含不同相的HEAs。这些区域面积不大,但是包含的数量却很大。这种高度的混合程度导致了这些样品之间的错误分类。
在间隔较大的情况下,DT模型可以很好地区分这两相HEAs。在测试集中的13种非晶相合金中,只有ZrHfTiCuCo在混淆矩阵中被错误地划分为多相,证明了该模型在相识别方面的有效性。
图7HEAs的DT可视化图
DT模型选择了四个重要特征(VEC,)作为HEAs相形成过程中的重要因素。在Hume-Rothery规则中,合金组分原子的尺寸差异是影响固溶相形成的最重要因素。在DT模型中,选择原子尺寸差()作为DT模型的根节点。证明了是HEAs相位分类模型最重要的特征。
Hume-Rothery规则的三个因素之一VEC不仅影响二元合金金属相的稳定性,而且影响HEAs中不同固溶体相的形成。从收集的HEAs数据分布来看,FCC和BCC结构在原子尺寸上的差异非常小。但是,FCC和BCC在图7中显示了VEC维度上的类间分离现象。。结果表明,VEC对HEAs中相的稳定性也起着决定性的作用。在HEAs相分类的DT模型中,BCC相在较低VEC(≤6.07)下稳定,而FCC相在较高VEC(>7.82)下稳定。
对于用来反应无量纲混合焓方差的参数,有两个关键的值:大于0.595的是多相固溶体HEAs,小于0.27的是单相固溶体HEAs。熵在相形成中同样起着重要的作用。无量纲参数
可视为合金排序的“熵”指标,它将合金实例分为单相(BCC和HCP)和多相。由图8可知,当
>17.34时,高熵合金倾向于呈现单相固溶体。
研究结论
VEC,)。这4个因子中有2个(和VEC)都与Hume-Rothery规则相符,说明Hume-Rothery规则对HEAs设计仍有极其重要的指导意义。
(3)DT模型的决策规则在一定程度上挖掘HEAs相形成过程中的定量结构-性质关系。当原子尺寸差(δr)大于8.295%时,单相固溶体的形成能力往往受到抑制。
团队介绍
钱权,博士,上海大学教授、博导、伟长学者。2003年7月毕业于中国科学技术大学计算机应用专业。目前任上海大学计算机学院智能科学系主任。研究领域涉及材料大数据、机器学习及工业化应用、网络安全、隐私计算等,主持完成国家重点研发计划及省部级科研项目30余项。已发表学术论文100余篇,拥有发明专利和软件著作权50余项。
张惠然,博士,2011年毕业于日本国立富山大学生命融合科学教育部,现就职于上海大学计算机工程与科学学院。主要研究领域涉云计算、机器学习及人工智能方法在材料数据中的领域的应用等。2012年以来参与上海市材料基因工程研究院建设、之江实验室的计算材料方法的研究工作。参与多项国家重点研发计划。参与发表论文40余篇。
胡瑞,上海大学计算机工程与科学学院硕士研究生。主要从事基于数据驱动和机器学习的材料科学应用,主要方法涉及图神经网络、面向材料研究中的机器学习算法理解与应用等。
戴东波,理学博士。1977年1月生,2010年毕业于复旦大学计算机软件与理论专业,获博士学位。现任教于上海大学计算机学院高性能计算研究室,研究领域为数据库,数据挖掘和生物信息学和材料信息学。曾参加了国家863项目和国家自然科学基金项目,在国内权威刊物如软件学报,计算机研究与发展,电子学报等刊物以及国际知名数据库会议如CIKM,SSDBM等上发表论文10余篇,也曾在信息材料方面发表知名SCI期刊论文多篇。
阅读原文
往期推荐
会议通知论文投稿截止至8月20日|2023(第二届)中国铜产业科技创新大会暨国家铜冶炼及加工工程技术研究中心第四届学术年会期待您的投稿!2023(第三届)国际有色金属新材料大会(ICNFM)的通知
酒店预定已上线|关于召开第十六届中俄双边新材料新工艺研讨会
酒店预定已上线|第十届国际铅锌会议(Pb-Zn2023)
会议通知|第十五届全国分子束外延学术会议会议通知会议通知|第十届国际铅锌会议(Pb-Zn2023)关于开展2023年度中国有色金属工业科学技术奖励推荐工作的通知关于召开第十六届中俄双边新材料新工艺研讨会的通知(第一轮)
征集通知
中国有色金属学会关于举办2023年“科学也偶像”短视频征集活动的通知关于推荐第五届杰出工程师计划候选人的通知关于第三届NFSOC高等教育教学成果计划推荐工作的通知
关于开展中国科协“青年人才托举工程(2023-2025年)”项目申报工作的通知中国有色金属学会关于征集会员单位和个人会员宣传资料的通知中国有色金属学会关于征集智库成果的通知