中国有色金属学报

DOI:10.19476/j.ysxb.1004.0609.2001.03.029

基于人工神经网络的凝固组织晶粒尺寸预测

訾炳涛 崔建忠 巴启先 姚可夫

  清华大学机械工程系!北京100084  

  东北大学材料与冶金学院!沈阳110006  

摘 要:

通过分析强脉冲电磁场作用下铝合金凝固组织晶粒尺寸实验数据 , 并结合人工神经网络 , 建立了强脉冲电磁场作用下铝合金凝固组织晶粒尺寸的人工神经网络BP算法模型。研究结果表明 , 用该神经网络模型进行模拟得到的计算结果和实验数据吻合得较好 , 因此这一方法可用来对强脉冲电磁场作用下的凝固组织晶粒尺寸进行预测和控制 , 为优化实验设计提供了简便、实用的方法和手段

关键词:

凝固组织;晶粒尺寸;人工神经网络;BP算法模型;

中图分类号: TG111.4

收稿日期:2000-09-21

基金:国家重点基础研究发展规划基金资助项目 (G19990 64 90 0 -0 5 );教育部电磁过程重点实验室访问学者基金资助项目;

Application of artificial neural network in predicting grain size of solidification structure

Abstract:

After analyzing the experimental data of the solidified grain size in Al alloy under strong pulsed electromagnetic field, a BP algorithmic model of artificial neural network was established. The results show that the simulating results are better in agreement with the experimental results. Therefore, this BP algorithmic model of artificial neural network can be used to control the parameters and predict solidified grain size under applied strong pulsed electromagnetic field. It provides an easy and practical method and means for optimizing experimental design.[

Keyword:

solidification structure; grain size; artificial neural network; BP arithmetic model;

Received: 2000-09-21

对金属凝固过程进行强脉冲电磁场处理是近几年才发展起来的一种新颖独特的凝固组织细化法 [1,2,3] , 它具有细化效果显著、 无污染 (即不改变合金原有成分) 、 操作简便等特点。 作者在文献 [ 1] 中给出了强脉冲电磁场作用下LY12铝合金的晶粒尺寸随强脉冲电流密度和强脉冲磁感应强度的变化曲线。

传统的晶粒度测定是先制备金相试样, 再在显微镜下用不同的方法计算出晶粒尺寸或数量, 然后按一定算法求出晶粒度 [4,5] 。 该办法沿用了多年, 但仍存在缺点: 1) 一般的晶粒度分级均是定性或半定量的; 2) 操作过程繁复、 不便, 而且人为影响因素较多, 误差大; 3) 晶粒度不仅是一个统计概念, 而且还与放大倍数、 所取视场的大小和位置、 腐蚀剂的类型、 晶粒的形状和取向、 人们对晶界的理解程度等因素有关。 为了减少测量中的麻烦和各种误差, 作者提出了用人工神经网络 [6,7,8,9,10,11] 对强脉冲电磁场作用下的LY12铝合金凝固组织晶粒尺寸进行预测, 并通过样本数据检验该模型的可行性和抗干扰能力。

1BP算法模型

1.1BP神经网络的特点

采用的误差反向传播的BP型神经元网络是一个有导师指导学习的前向人工神经元网络。 该神经网络一般有三层神经元连接, 同一层的神经元之间无任何连接, 而层与层的神经元之间采用全连接方式。 其连接强度或记忆强度用权重或权值表示, 正的权值表示影响的增加, 负的权值表示影响的减弱。 BP模型在学习训练过程中, 存在2种相反的信息传递路线: 正向传播和反向传播。 在正向传播过程中, 其输入信息从输入层经过隐层逐层处理, 并传向输出层, 这时, 每一层的神经元状态只影响下一层的神经元状态。 若在输出层不能得到期望的输出, 则转入反向传播, 将误差信号沿原来的连接通路返回, 并通过修改各层神经元的权值和阀值, 使输出层误差达到最小, 从而完成网络的学习过程。 当权值和阀值调整到适应于一组样本后, 则该网络模型就已经建立, 而且该模型还可以对其它样本继续学习, 以使其具有更广泛的适应性, 而不必重新构造一个新的网络结构。

BP神经元网络把一组样本的输入/输出 (I/O) 问题转变为一个非线性优化问题, 并使用优化方法中最普遍采用的梯度下降法, 用迭代运算求解权值, 加入隐层节点使优化问题的可调参数增加, 从而得到更精确的题解。 它可直接从实验数据进行学习, 而对所建立的网络模型未做任何假设; 而且, BP网络模型可对实验数据建立起由输入矢量空间到输出矢量空间的复杂非线性关系的直接映射。 如果输入矢量空间的输入层节点数为m, 输出层空间的输出层节点数为n, 则该BP网络可看作是从矢量空间Rm到矢量空间Rn的映射, 即有以下关系成立:

F: RmRn, Y=F (X) (1)

对于样本集合X和输出Y, 可认为存在某一映射G, 使

Yi=G (Xi) , i=1, 2, …, k (2)

式中 (Xi, Yi) 为样本的输入-输出矢量对。

1.2 凝固晶粒尺寸模型

本文采用的BP网络模型为3×4×1型结构, 共有3层神经元连接, 即输入层、 中间隐层和输出层, 如图1所示。 输入层有3个节点, 即在强脉冲电磁场细化金属凝固组织工艺 [1,3] 中, 主要有3个影响因素X1, X2X3, 分别表示放电电压、 电容量和强脉冲电流密度 (或强脉冲磁感应强度) ; 输出层只有一个节点, 表示凝固组织晶粒尺寸D; 中间层为隐含层, 本文取4个节点Yj (j=1, 2, 3, 4) 。

图1 3×4×1结构BP人工神经元网络模型

Fig.1 3×4×1 structure model of BP artificial neural network

输入层采用线性单元; 中间隐层采用非线性单元, 其第j个单元的输入Nj可通过把输入层各单元的输出加权求和得到, 其输出Yj是由其输入Nj经过非线性函数f (x) 求得; 输出层则采用一个非线性单元, 其输入N可由隐层各单元的输出Yj加权求和得到, 其输出D (即晶粒尺寸) 亦由其输入N经过同一个非线性函数f (x) 求得。 输入层-隐层及隐层-输出层之间的连接权值分别表示为VjiWj

鉴于神经网络的特点, 对所有的输入层和输出层的参数均做了归一化处理, 使所有参数的取值落在[0, 1]范围内。 该BP型人工神经元网络的正向、 反向传播的学习与训练过程如下:

① 置VjiWj为[-0.5, 0.5]之间的随机数。

② 选取学习率η, 动量项系数α, 并置X4=Y5=-1。

③ 从输入层到输出层, 逐层计算每个单元的输出。

隐层:

Nj= i = 1 4 V j i X i , j=1, 2, 3, 4 (3)

Yj=f (Nj) (4)

输出层:

Ν = j = 1 5 W j Y j ? ? ? ( 5 )

D=f (N) (6)

这里, 取激励函数

f ( Ν ) = 1 - e - Ν 1 + e Ν ? ? ? ( 7 )

式 (3) ~ (7) 中将阀值归入VjiWj, 它们与固定为-1的输入相连接。

④ 计算该网络的系统误差。 设有P组学习样本, 则该系统的均方误差

E = 1 2 Ρ n = 1 Ρ ( D n - D n ) 2 ? ? ? ( 8 )

式中 Dn表示第n个学习样本的实验值, 通常被称为导师信号; Dn则表示相应网络的实际输出值。

⑤ 如果该网络的系统误差E满足设计要求或达到指定的学习次数, 则结束学习, 否则进行以下步骤。

⑥ 逐层计算网络中各单元的学习信号:

δ= (D-D′) f′ (N) (9)

δj=Wjδf′ (Nj) , j=1, 2, 3, 4 (10)

⑦ 按梯度下降方向自修正权值:

Wj (t+1) =Wj (t) +ηδYj+

α[Wj (t) -Wj (t-1) ] (11)

Vji (t+1) =Vji (t) +ηδjXi+

α[Vji (t) -Vji (t-1) ] (12)

⑧ 转至②继续执行 (必要时, 可适当调整学习率和动量项系数的大小) 。

2 模拟结果及分析

所有模拟计算工作均在AMD K6 (tm) /233 CPU的PC机上进行。 当迭代进行到2万次后, 系统误差基本上稳定在4.4×10-4, 已能够完全满足设计或实际要求, 如图2所示。 图3则给出了模拟与实验 [1] 的比较结果。

通过模拟运算发现, 经过2万次的迭代学习与训练, 该网络的实际输出值与实验值很接近。 所有样本的模拟计算结果的相对误差均在11%以内, 甚至个别样本的相对误差为0, 如表1所示。 所以, 用该学习与训练过程得到的网络连接权值即可作为强脉冲电磁场作用下的LY12铝合金凝固组织晶粒尺寸的预测和控制模型, 并可用它对别的实验样本和新的实验数据进行学习和训练, 以及对后期的实验结果进行预测。

图2 相对误差随训练次数的变化曲线

Fig.2 Curve of relative error vs training step

图3 模拟计算结果与实验结果 [1]的比较

Fig.3 Comparison between simulation data and experimental data [1] (a) —Effect of strong pulsed electric current (b) —Effect of strong pulsed magnetic field

为了检验该人工神经网络BP算法模型的抗干扰能力, 分别对3个检验样本的输入数据进行了改变, 然后再模拟, 所得的模拟计算结果如表2所示。 可见, 虽然改变了其中个别数据, 但并不影响模拟计算结果的准确性。 这表明该网络模型具有较强的稳定性和抗干扰能力。

表1 模拟计算结果及相对误差

Table 1 Simulation data and relative errors

X1
/kV
X2
/μF
X3
/ (A·mm-2)
X3
/T
D
/mm
D
/mm
Relative
error/%
0 0 0 0.63 0.63 0

3
80 40 0.46 0.49 6

4
80 56 0.44 0.42 5

5
80 68 0.42 0.39 8

6
80 75 0.42 0.47 11

7
80 97 0.44 0.42 5

4
160 78 0.39 0.43 9

4
240 100 0.35 0.32 9

4
320 112 0.35 0.38 8

2
80 1.7 0.43 0.43 0

3
80 2.5 0.37 0.36 3

4
80 3.3 0.33 0.34 3

5
80 4.1 0.32 0.33 3

6
80 5.0 0.33 0.31 6

7
80 5.8 0.35 0.35 0

表2 模拟干扰结果及相对误差

Table 2 Disturbed data and relative errors

X1
/kV
X2
/μF
X3
/ (A·mm-2)
X3
/T
D
/mm
D
/mm
Relative
error/%

7#
80 68 0.38 0.39 3

4
240# 112 0.35 0.38 8

2
80 3.3# 0.44 0.43 2

Data labeled# were changed to predict the anti-disturbance and stability of the model.

需要说明的是, 在实际应用中, 学习率η或学习步长的选取是一个至关重要的因素, 它对学习效果影响很大。 η取值越大, 虽然学习速度加快, 每次权值的改变也越激烈, 但大的η值容易使学习过程陷于局部极小, 或容易使权重系数产生反复震荡而不能收敛。 而η取值越小, 则学习速度越慢, 占用机时越多, 学习效率越慢。 一般地, 在学习的初期, 可使η值取大一些, 这样可加快学习速度, 提高学习效率; 但在接近最佳点时, 必须使η的取值小些, 以避免使权重产生震荡造成不能收敛。

3 结论

用人工神经元网络方法建立了强脉冲电磁场作用下的凝固组织晶粒尺寸BP算法模型。 用该模型得到的模拟计算结果和实验结果基本吻合。 该模型预测精度高、 误差小, 且具有较强的抗干扰能力和稳定性。 用该网络模型可以较好地对金属凝固组织晶粒尺寸进行预测和控制。

参考文献

[1] ZIBing tao (訾炳涛 ) , BAQi xian (巴启先 ) , CUIJian zhong (崔建忠 ) , etal.强脉冲电磁场对金属凝固组织的影响 [J].ActaPhysicaSinica (物理学报 ) , 2 0 0 0 , 49 (5 ) :10 10 - 10 14.

[][2 ] ZIBing tao , BAQi xian , CUIJian zhong , etal.Studyonaxialchangesofas caststructuresofAl alloysampletreatedbythenovelSPMFtechnique [J].ScriptaMate rialia , 2 0 0 0 , 43 (4) :377- 380 .

[3]  ZIBing tao (訾炳涛 ) .LY12铝合金凝固组织的脉冲电磁细化新工艺研究 [D].Shenyang :NortheasternUni versity , 2 0 0 0 .

[4 ] TUShi run (屠世润 ) , GAOYue (高 越 ) .TheoryandPracticeofMetallography (金相原理与实践 ) [M ].Bei jing :MechanicalIndustryPress, 1990 .

[5 ] QINGuo you (秦国友 ) .QuantitativeMetallography (定量金相 ) [M ].Chengdu :SichuanScienceandTechnolo gyPress , 1987.

[][6 ] SHIHong bao (施鸿宝 ) .NeuralNetworkandItsAppli cation (神经网络及其应用 ) [M].Xi′an :Xi′anJiaotongUniversityPress, 1993.

[7]  Dobrza澖skiLA , SitekW .Applicationofaneuralnet workinmodellingofhardenabilityofconstructionalsteels[J].JournalofMaterialsProcessingTechnology , 1998, 78:5 9- 6 6 .

[8] KorczakP , DyjaH , LabudaE .Usingneuralnetworkmodelsforpredictingmechanicalpropertiesafterhotplaterolling processes [J].JournalofMaterialsProcessingTechnology , 1998, 80 - 81:481- 486 .

[9] YULi juan (于丽娟 ) , ZHUChang chun (朱长纯 ) .用人工神经网络预测场发射开启电场 [J].ActaPhysicaSinica (物理学报 ) , 2 0 0 0 , 49 (1) :170 - 172 .

[][10 ] SHUANGYuan hua (双远华 ) , FANJian cheng (樊建成 ) , LAIMing dao (赖明道 ) .人工神经网络对管材张减精度预测 [J].IronandSteel (钢铁 ) , 2 0 0 0 , 35 (2 ) :2 8- 31.

[11] QILe hua (齐乐华 ) , HOUJun jie (侯俊杰 ) , YANGFang (杨 方 ) , etal.金属液体凝固中直接挤压工艺的神经网络 [J].TheChineseJournalofNonferrousMetals (中国有色金属学报 ) , 1999, 9 (3) :5 86 - 5 89.

[1] ZIBing tao (訾炳涛 ) , BAQi xian (巴启先 ) , CUIJian zhong (崔建忠 ) , etal.强脉冲电磁场对金属凝固组织的影响 [J].ActaPhysicaSinica (物理学报 ) , 2 0 0 0 , 49 (5 ) :10 10 - 10 14.

[][2 ] ZIBing tao , BAQi xian , CUIJian zhong , etal.Studyonaxialchangesofas caststructuresofAl alloysampletreatedbythenovelSPMFtechnique [J].ScriptaMate rialia , 2 0 0 0 , 43 (4) :377- 380 .

[3]  ZIBing tao (訾炳涛 ) .LY12铝合金凝固组织的脉冲电磁细化新工艺研究 [D].Shenyang :NortheasternUni versity , 2 0 0 0 .

[4 ] TUShi run (屠世润 ) , GAOYue (高 越 ) .TheoryandPracticeofMetallography (金相原理与实践 ) [M ].Bei jing :MechanicalIndustryPress, 1990 .

[5 ] QINGuo you (秦国友 ) .QuantitativeMetallography (定量金相 ) [M ].Chengdu :SichuanScienceandTechnolo gyPress , 1987.

[][6 ] SHIHong bao (施鸿宝 ) .NeuralNetworkandItsAppli cation (神经网络及其应用 ) [M].Xi′an :Xi′anJiaotongUniversityPress, 1993.

[7]  Dobrza澖skiLA , SitekW .Applicationofaneuralnet workinmodellingofhardenabilityofconstructionalsteels[J].JournalofMaterialsProcessingTechnology , 1998, 78:5 9- 6 6 .

[8] KorczakP , DyjaH , LabudaE .Usingneuralnetworkmodelsforpredictingmechanicalpropertiesafterhotplaterolling processes [J].JournalofMaterialsProcessingTechnology , 1998, 80 - 81:481- 486 .

[9] YULi juan (于丽娟 ) , ZHUChang chun (朱长纯 ) .用人工神经网络预测场发射开启电场 [J].ActaPhysicaSinica (物理学报 ) , 2 0 0 0 , 49 (1) :170 - 172 .

[][10 ] SHUANGYuan hua (双远华 ) , FANJian cheng (樊建成 ) , LAIMing dao (赖明道 ) .人工神经网络对管材张减精度预测 [J].IronandSteel (钢铁 ) , 2 0 0 0 , 35 (2 ) :2 8- 31.

[11] QILe hua (齐乐华 ) , HOUJun jie (侯俊杰 ) , YANGFang (杨 方 ) , etal.金属液体凝固中直接挤压工艺的神经网络 [J].TheChineseJournalofNonferrousMetals (中国有色金属学报 ) , 1999, 9 (3) :5 86 - 5 89.