基于人工神经网络的Cu与Mg低质量比Al-Cu-Mg合金时效强化预测模型
侯延辉1, 2,刘志义2,邓才智2,刘延斌2,马飞跃2
(1. 西南交通大学 应用力学与工程系,四川 成都,610031;
2. 中南大学 材料科学与工程学院,湖南 长沙,410083)
摘 要:通过硬度检测和透射电镜(TEM)观察,研究低Cu/Mg质量比Al-Cu-Mg合金时效强化机理,建立神经网络预测模型,使其在实验条件范围内对时效力学性能进行有效预测。在实验基础上,采用Levenberg-Marquardt算法训练神经网络,建立以时效温度与时间为输入参数和硬度为目标函数的函数关系。结果表明:预测值与实验结果吻合较好,并证明了网络的可靠性与泛化能力;当时效温度越高时,达到峰值时效的时间越短,峰值时效的硬度也越大;在160~190 ℃时效温度范围内,合金峰值硬度随时效温度的升高而下降,对应硬度峰值的时效时间缩短。
关键词:时效;Levenberg-Marquardt算法;神经网络;析出相;模型
中图分类号:TG 146.2 文献标识码:A 文章编号:1672-7207(2009)03-0657-06
Ageing prediction model for low mass ratio of Cu to Mg of Al-Cu-Mg alloy based on neural network
HOU Yan-hui1, 2, LIU Zhi-yi2, DENG Cai-zhi2, LIU Yan-bin2, MA Fei-yue2
(1. Department of Applied Mechanics and Engineering, Southwest Jiaotong University, Chengdu 610031, China;
(2. School of Materials Science and Engineering, Central South University, Changsha 410083, China)
Abstract: On the basis of experiment, neural network model was established, which could predict the mechanical performance of ageing Al-Cu-Mg alloy with low mass ratio of Cu to Mg effectively. In order to obtain the relationship between the parameters and the mechanical performance, experiments were carried out in which the ageing temperature and time were input parameters and hardness was output parameter. The function between the input and output parameters were constructed by neural network trained by Levenberg-Marquardt algorithm. The result shows that the model has high precision and good performance, which provides theoretical foundation for further study of the effect rule of ageing parameters on mechanical property and for optimal design of the ageing process.
Key words: ageing; Levenberg-Marquardt algorithm; neural network; precipitation; modeling
低Cu/Mg质量比Al-Cu-Mg合金由于具有较大的强度,较强的断裂韧性以及优良的抗疲劳性能,在航空航天领域和汽车制造业得到广泛应用。为了控制和优化热处理过程,必须了解在不同的热处理阶段存在哪种析出相,了解不同温度时的析出动力学过程。一般认为,低Cu/Mg质量比Al-Cu-Mg合金时效过程为:Cu-Mg原子团簇/GPB区 。据Ringer等[1-2]研究报道,在Al-Cu-Mg合金时效早期Mg/Cu原子簇形成,它被看作GPB的先驱相。GPB区(Al2CuMg)在早期的X射线衍射中被发现,它的形状为棒状,半径为1~2 nm,长度为4 nm,沿基体的<100>方向生长[3]。S相(Al2CuMg)为棒状,是合金中的稳定相,沿<100>方向在{210}惯性面上长 大[4]。Cu-Mg原子团簇与GPB区从大小、形状、组分、有序度、方位与结构上存在区别[4]。据文献[5]报道,S′的析出并不是直接在GPB区上形核长大,而是S′相重新形核长大过程伴随着GPB区的溶解以提供足够的溶质原子。S′相是S相的变形状态,不能完全把它们区分为2种相[6]。
合金的力学性能在很大程度上取决于其内部的微观结构,通过时效过程的数值模拟来控制粒子的种类、数量、形状等,从而影响材料的微观结构的演化,是改善材料性能的有效方法之一。时效强化铝合金析出动力学与强化过程的数值模拟引起了人们广泛的关注。强化模型是基于Orowan方程发展而来的[7-8]。Kanpmann与Wagner[9]对液滴形成理论进行了改进,使它应用于析出相的形成(MLS模型)的动力学过程。后来,Kanpmann和Wagner发展了新的数值模型,它不依赖于先前的假设,可以预测析出相大小分布的全部演变过程(KWN)模型。这些模型用来预测析出相大小分布的演变,但没有对形核、长大及粗化阶段进行专门区分,该模型已被应用于多种合金析出相的预 测[10-11]。然而,多数模型假设为单一的析出相或应用于不同溶质原子的多析出相,在此基础上建立的伪二元时效强化预测模型,只有较少模型研究了具有相同溶质原子在多种析出相中的分配情况。
低Cu/Mg质量比Al-Cu-Mg合金在不同的时效温度和时间时有不同的析出相,各种析出相存在的温度和时间范围还没有定量的预测模型,溶质原子在2种强化相中分配的定量关系尚不明确,导致析出动力学方程组不再封闭,使得模型还不能得到理论求解,这在一定程度上限制了它的应用。在时效过程中,各工艺参数与性能之间处于高度非线性的状态,传统的模型难以精确地描述他们之间的关系,而神经网络可以通过对样本数据的学习识别复杂变量中输入与输出之间的关系,通过对输入与输出响应进行比较分析建立模型,对复杂过程进行有效控制。
1 建立神经网络预测模型
1.1 BP网络原理
BP(误差反向传播神经网络)网络是目前应用最为广泛和成功的神经网络之一。其基本思想是:学习过程由信号的正向传播和误差的反向传播2个过程组成。正向传播时,输入样本由输入层传入,经过隐含层处理后传向输出层,并且每一层神经元的状态只影响到下一层神经元的状态。若输出层的实际输出与所希望的输出值不符,则转向误差的反向传播阶段。在误差的反向传播是将输出误差以某种形式通过隐层向输入层逐层传播,这个误差信号是作为修正各个单元权值的依据。权值不断调整的过程,就是网络的学习训练过程,一直到网络输出的误差减少到可以接受的程度即预先设定的学习次数为止[12]。算法的求解过程如下[13]。
b. 输出层(隐节点到输出节点间)的修正公式:
c. 隐节点层(输入节点到隐节点数)的修正公式:
由于在理论上已经证明具有3层结构(只有1个隐含层) 的BP网络能够完成任意的n维到m维的映 射[13],故这里选用3层BP网络建模以逼近存在于数据间的函数关系。
1.2 学习样本的获取
试验材料为厚度为66 mm的铝合金厚板。合金成分如表1所示。
表1 实验合金的化学成分
Table 1 Composition of experimental alloy 质量分数/%
合金铸锭经均匀化、铣面、热轧成2 mm厚的板材。合金经505 ℃/1 h固溶水淬后立即进行人工时效处理。人工时效处理在硅油中进行,取3个不同的时效温度160,175和190 ℃,时效时间为10 min~48 h变化。人工时效后立即测其硬度。硬度测试在HV-10B小负荷维氏硬度计上进行,载荷为30 N,维持时间 15 s,每个试样取6个点,取其平均值作为测量值。透射电子显微镜分析试样采用双喷电解减薄制取,电解液为30%(体积分数)硝酸和70%甲醇的混合液,电镜观察在TECNAL-G220透射电镜上进行,加速电压为200 kV。所得的样本硬度如表2所示。
表2 不同时效温度和时效时间时样本的硬度
Table 2 Hardness of specimens aged at different temperatures for different time
1.3 BP神经网络预测模型的训练
训练网络的学习样本取自实验值,其中25个用于网络训练,2个用于检验网络的预测能力。在网络训练过程中,如果变量在数值上相差太大,输出值大的神经元误差是网络误差中的主要成分,而较小的输出变量的相对误差较大。为使得各变量的重要性处于同等地位,使网络所有权值在一个不太大的范围之内,对样本数据进行归一化处理,使所有数据在[0, 1]之间的网络空间变化。数据中的最大值为Xmax,最小值为Xmin,则X组数据在归一化后的值为:
网络的输出结果经反归一化得到其原物理空间中的值:
BP 算法的目的是使误差平方和最小,按梯度最速下降法反向传播调整网络权值,直到满足训练要求为止。在所有的基于梯度的算法中,基于高斯-牛顿法改进得到的Levenberg-Marquardt方法在实际应用中稳定性效果很好,已经成为解决非线性最小二乘的标准算法[14],它是建立在一种优化方法基础训练算法,因此,本文采用Levenberg-Marquardt算法对权值和阈值进行训练。
BP网络的隐层从输入数据中提取特征知识,网络的泛化能力取决于隐层。对于隐层单元的选择参照文献[15]中经验公式:。式中:m为输出神经元数;n为输入神经元数;a为1~10之间的常数。本模型中,n=2,m=1,隐层的结点数范围为3~11。以时效时间和温度2个工艺参数为网络输入,抗拉强度、屈服强度和伸长率为输出训练网络。网络采用2-11-3结构,学习率取为0.1。理论证明,S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数,本文中网络的隐含层神经元的传递函数选用双曲正切S型传递函数tansig,输出层神经元传递函数选用对数S型传递函数logsig。
2 结果与讨论
2.1 拟合结果
图1所示为实验和神经网络预测的时效力学性能。由图1可知,预测值与实验值基本吻合。图2所示为网络预测的相对误差,相对误差在-0.035~0.035的范围内,表明具有较高的预测精度。表3所示为样品的实验值与比较值对比结果。可见,该网络具有较强的泛化能力。
1—160 ℃时效实验值;2—160 ℃神经网络预测值;3—170 ℃时效实验值;4—170 ℃神经网络预测值;5—190 ℃时效实验值;6—190 ℃神经网络预测值
图1 合金时效硬化曲线
Fig.1 Ageing hardening curves of alloy
1—160 ℃;2—175 ℃;3—190 ℃
图2 网络训练结果的相对误差
Fig.2 Relative errors of neural network predictions
表3 验证样本硬度的实验值与输出值比较
Table 3 Comparison of predicted hardness with experimental hardness of test samples
在20世纪90年代前期的研究工作中,认为硬化是由于存在GPB区,它的形状为棒状。Ratchev等[16]认为,低Cu/Mg质量比Al-Cu-Mg合金快速硬化是由于螺旋位错线原子团簇的形成和S″相的均匀形核,这与图1所示的时效硬化曲线是一致的:曲线存在双阶段硬化特性,第1阶段的硬化来自GPB区,第2阶段的硬化来自S″,S′与S相的共同作用。
第1阶段的硬化出现得很快,大约在60 s甚至更短的时间内完成,这个阶段的硬度达到总硬度增量的60%左右,而且在Al-Cu-Mg合金中较宽的时效温度范围内有相类似的情况。处在这个时效阶段的合金没有明显的S′相析出,只是出现大量的溶质原子团簇或者溶质原子偏聚区。
第2阶段的硬化时间根据不同的温度有所不同,温度越高,达到峰值时效的时间越短。当时效温度越高时,原子扩散速率依次加快,析出相较快地吸收了附近的溶质原子而长大,因此,达到峰值时效的时间依次缩短。同时,温度越高,峰值时效的硬度值也越大,这与Al-Cu-Mg-Ag合金时效强化的情况截然相反,这是由它们不同的形核机理决定的。在Al-Cu-Mg合金中,当GPB区达到临界状态时,S′相开始形核长大的同时,消耗GPB区的溶质原子。在相对低温时效时,原子扩散速率相对较低,过饱和溶质原子有足够的时间形成原子团簇并开始长大,由于GPB区平均尺寸较大,很难重新回熔,使基体内没有充足的溶质原子提供给S′相大量析出,因此,合金强度与第1阶段相比变化不大;在Al-Cu-Mg-Ag合金中,时效温度越低,原子扩散速率也相对较低,过饱和固溶体有足够的时间形成原子团簇并最终以相析出,此时,相具有较高的密度和较小的间距,提高了合金的峰值强度。
2.2 显微组织对力学性能的影响
变形铝合金时效强化主要来自于强化相与位错的交互作用[17]。当滑移遇到障碍时,位错必须绕过或切割沉淀相,Al-Cu-Mg时效合金的析出相是具有高硬度的棒状析出相,使得材料在变形时产生的位错难以在短暂的时间内向前攀移,变形阻力增加,强度增大。因而,析出相数量越多,分布越弥散,合金的强度越大。图3所示为合金在160,175和190 ℃峰值时效时晶内析出相的TEM像。
(a) 160 ℃,32 h;(b) 175 ℃,24 h;(c) 190 ℃,16 h
图3 峰值时效时合金的微观组织与衍射斑点
Fig.3 Microstructures and corresponding electron diffraction pattern under peak-aged conditions
图3(a)中合金没有明显的析出相,但是,衍射斑点中的衍射茫清晰可见,基体中的GPB区尺寸较大。位错的主要形态为螺型位错,淬火时空位崩塌形成位错环,在时效过程中,有空位继续扩展到这些位错环的中心时,就会沿着这些位错环形成螺型位错。图3(b)中合金有细小且分布不均匀的S′相析出,时效强化是由于S′相与GPB区的共同作用。图3(c)中基体中析出了大量细小均匀弥散的S′相。强化相的数量、细小程度和弥散分布程度明显高于前两者,因此,190 ℃峰值时效的硬度最高。
3 结 论
a. 研究Al-Cu-Mg对合金力学性能影响比较显著的2个工艺参数,以有限的实验结果作为神经网络的训练样本,通过对神经网络的选择、建立、训练到测试,建立Al-Cu-Mg时效强化的神经网络模型,对力学性能进行预测,预测结果与实验结果吻合较好,并具有较强的泛化能力。
b. 合金存在双阶段硬化特征,即第1阶段的硬化来源于GPB区的析出,第2阶段的硬化取决于S′相的析出;在160~190 ℃时效温度范围内,合金峰值硬度随时效温度的升高而下降,对应硬度峰值的时效时间缩短。
参考文献:
[1] Ringer S P, Hono K, Polmear I J. Precipitation processes during the early stages of ageing in Al-Cu-Mg alloys[J]. Scripta Mater, 1996, 94: 253-260.
[2] Ringer S P, Sakurai T, Polmear I J. Origins of hardening in aged Al-Cu-Mg-(Ag) alloys[J]. Acta Mater, 1997, 45 (9): 3731-3744.
[3] Wolverton C. Crystal structure and stability of complex precipitate phases in Al-Cu-Mg-(Si) and Al-Zn-Mg alloys[J]. Acta Mater, 2001, 49: 3129-3142.
[4] Ratchev P, Verlinden B, Smet P D, et al. Precipitation hardening of an Al-4.2wt%Mg-0.6wt%Cu alloy[J]. Acta Mater, 1998, 46(10): 3523-3533.
[5] Majimel J, Molenat G, Casanove M J, et al. Investigation of the evolution of hardening precipitates during thermal exposure or creep of a 2650 aluminium alloy[J]. Scripta Mater, 2002, 46(2): 113-119.
[6] Gouma P I, Lloyd D J, Mills M J. Precipitation processes in Al-Mg-Cu alloys[J]. Materials Science and Engineering, 2001, A319/321: 439-442.
[7] Gilmore D L, Starke E A. Trace element effects on precipitation processes and mechanical properties in an Al-Cu-Li alloy[J]. Metallurgical and Materials Transactions, 1997, 28(77): 1399-1415.
[8] Kocks U F. The theory of an obstacle-controlled yield strength—Report after an international workshop[J]. Materials Science and Engineering, 1977, 27(3): 291-298.
[9] Kampmann R, Wagner R. Analysis of creep pore formation in liquid-phase sintered alumina[J]. Materials science and Engineering, 1997, A234/236: 932-935.
[10] Robson J D, Jones M J, Prangnell P B. Extension of the N-model to predict competing homogeneous and heterogeneous precipitation in Al-Sc alloys[J]. Acta Materialia,2003, 51(5): 1453-1468.
[11] Robson J D. Microstructural evolution in aluminium alloy 7050 during processing[J]. Materials Science and Engineering, 2004, 382(1): 112-121.
[12] 朱大奇, 史 慧. 人工神经网络原理及应用[M]. 北京: 科学出版社, 2006.
ZHU Da-qi, SHI Hui. Theory and application of artificial neural network[M]. Beijing: Science Press, 2006.
[13] 闻 新. Matlab神经网络应用设计[M]. 北京: 科学出版社, 2000.
WEN Xin. Application design of neural network using Matlab[M]. Beijing: Science Press, 2000.
[14] 张智星, 孙春在, 水谷英. 神经-模糊和软计算[M]. 西安: 西安交通大学出版社, 1998.
ZHANG Zhi-xing, SUN Chun-zai, SHUI Gu-ying. Nerve-Fuzzy and soft computing[M]. Xi’an: Xi’an Jiaotong University Press, 1998.
[15] 飞思科技产品研发中心. 神经网络理论与MATLAB7实现[M]. 北京: 电子工业出版社, 2005.
R & D Technology Center of Feise. Theory of neural network and implementation in MATLAB7[M]. Beijing: Electronic Industry Press, 2005.
[16] Ratchev P, Verlinden B, Smet P D, et al. Precipitation hardening of an Al-4.2wt%Mg-0.6wt%Cu alloy[J]. Acta Mater, 1998, 46(10): 3523-3533.
[17] 黄志其, 尹志民, 马海龙. 时效对无铅易切削Al-Cu合金的微观组织结构与性能的影响[J]. 中南大学学报: 自然科学版, 2007, 38(4): 629-633.
HUANG Zhi-qi, YIN Zhi-min, MA Hai-long. Effect of aging treatment on microstructure and properties of lead-free free-cutting Al-Cu alloy[J]. Journal of Central South University: Science and Technology, 2007, 38(4): 629-633.
收稿日期:2008-04-28;修回日期:2008-06-14
基金项目:国家“973”重点基础研究发展项目(2005CB623705-04);中南大学国内博士生访学研究项目(1810-752300020)
通信作者:刘志义(1962-),男,湖南绥宁人,教授,博士生导师,从事材料加工与成型数值模拟研究;电话:0731-8836011;E-mail: Liuzhiyi@mail.csu.edu.cn