中南大学学报(自然科学版)

基于主成分分析与神经网络的采矿方法优选

陈建宏,刘浪,周智勇,永学艳

 (中南大学 资源与安全工程学院,湖南 长沙,410083)

摘  要:基于利用神经网络预测采矿方法存在一些不足,建立主成分分析法与神经网络结合的采矿方法优选模型。对神经网络的输入数据进行主成分分析,使输入数据不相关且减少。研究结果表明:利用主成分分析法可将输入数据减少,消除由于BP网络输入数据太多而影响数据处理速度的缺陷;把主成分分析法和神经网络结合进行采矿方法优选,可使预测精度大大提高。

关键词:

采矿方法主成分分析法BP神经网络

中图分类号:TD853          文献标志码:A         文章编号:1672-7207(2010)05-1967-06

Optimization of mining methods based on combination of principal component analysis and neural networks

CHEN Jian-hong, LIU Lang, ZHOU Zhi-yong, YONG Xue-yan

(School of Resources and Safety Engineering, Central South University, Changsha 410083, China)

Abstract: Based on the fact that the deficiencies of neural networks predict mining method, the optimization model of mining methods was set up combining principal component analysis with neural networks. The results show that using the principal component analysis can reduce input-data, eliminate the defect which is due to BP network input data too much influencing the data-processing speed. Combining principal components analysis with neural networks to optimize mining method can make the prediction accuracy improve greatly.

Key words: mining methods; principal components analysis; BP-neural networks

采矿方法在矿山生产中占有十分重要的地位,因为它对矿山生产的许多技术经济指标如矿山生产能力、矿石损失率和贫化率、成本及安全等都具有重要的影响[1-2],所以,采矿方法选择得是否合理和正确,将直接关系到矿山企业的经济效果和安全生产状况。传统的采矿方案仅仅是由单个影响因素或几个因素各自直观地评价而确定的,带有经验成分,容易受到经验的影响而不能正确反映实际情况。近年来,国内外学者提出了各具特色的选择方法,如模糊综合评价法、层次分析法和人工神经网络方法等。由于BP神经网络具有高度的非线性映射能力,所以广泛应用于采矿方法优选中。目前,在将神经网络应用到采矿方法选择方案中[3-4],很多忽视了输入变量之间存在相关性,但在应用BP网络进行预测建模时,输入变量过多,也会导致建模效率下降[5]。在此,本文作者将主成分分析法(Principle component analysis, PCA)与BP神经网络结合的方式建立采矿方法优选模型,首先采用主成分分析法对输入数据预处理,减少网络输入因子数,同时使输入因子彼此不相关,并且数据包括的主要信息还保留在主成分中。简化了网络结构,提高了网络学习速度,得到了较高的精度,大大提高了建模质量。

1  主成分分析法的基本思想与一般数学模型

1.1  主成分分析法的基本思想

在进行问题研究的过程中,为了系统地分析问题,必须考虑到众多对某些过程有影响的因素,所涉及的因素叫做指标,在多元统计分析中也称为变量。因素大多数问题涉及的众多变量之间都有一定的相关性,它们之间必然存在着支配作用的共同因素,根据这一点,通过对原始变量相关矩阵内部结构的研究,找出影响某一过程的几个综合指标,使综合指标为某一过程的几个综合指标,并且综合指标为原来变量的线性组合。综合指标不仅保留了原始变量的主要信息,彼此之间不相关,避免信息重叠,同时,又比原始变量具有某些优越性质,使得在研究复杂问题时更加容易。

1.2  主成分的几何意义

为了方便,在二维空间中讨论主成分的几何模型。

设有n个样品,每个样品中有2个观测量x1和x2,在由变量x1和x2所确定的二维平面中,n个样本点所散布的情况如图1所示。由图1可以看出:这n个样本点无论是沿着x1方向或x2方向都具有较大的离散性,其离散的程度可以由观测方差来度量。显然,如果只考虑x1和x2中的任何一个,则包含在原始数据中的信息将会有较大的损失。通过将x1和x2轴同时逆时针旋转θ,得到新的坐标轴y1和y2,如图2所示。旋转的目的是为了使n个样品点在y1轴方向的离散程度最大,即y1的方差最大,变量代表了原始数据的绝大

图1  x1和x2坐标系下样本点的分布

Fig.1  Distribution of sample point in x1-x2 system

图2  y1和y2坐标系下样本点的分布

Fig.2  Distribution of sample point in y1-y2 system

部分信息[6],在研究问题时即使不考虑y2,也无太大影响。

旋转公式为:

             (1)

       (2)

式中:为旋转变换矩阵,是正交矩阵,即有

1.3  主成分分析的一般数学模型

研究问题时常见的关于n个样品p个变量x1, x2, …, xp的问题(n>p),原始统计资料整理的原始数据矩阵为:

            (3)

通常,研究问题涉及的指标具有不同的量纲,有的指标量纲有很大的差异,因此,在研究问题时,不同量纲的数量级会引出新的问题。为了消除由于量纲不同可能造成的一些不合理的影响,在主成分分析前先对数据进行标准化处理[7],以使每一个变量的平均值为0,方差为1。变量标准化公式为:

               (4)

式中:分别为第j个变量的平均值和标准差;i=1, 2,…, n;j=1, 2,…, p。

利用式(4),数据标准化后的矩阵用x表示,即将的p个变量综合成p个新变量,新的综合变量可由原来的变量线性表示,即:

       (5)

并满足。其中:k=1, 2, …, p。系数uij由下列原则来确定:

(1)  yj与yij(i≠j; i, j=1, 2, …, p)相互无关;

(2)  y1为x1, x2, …, xp一切线性组合(系数满足式(1))中方差最大者;y2为与y不相关的x1, x2, …, xp的所有线性组合中方差最大者;yp为y1, y2, …, yp-1都不相关的x1, x2, …, xp所有线性组合中方差最大者。

以上确定的综合变量y1, y2, …, yp分别称为原变量的第1、第2,…,第p个主成分。其中:y1在总方差中占的比例最大,其余综合变量y2, y3, …, yp的方差在总方差中占的比例依次递减。选取主成分的个数取决于主成分的累积方差贡献率,累积贡献率越大,丢失的数据信息越少,但后续处理计算量大,所以,通常方差贡献率的取值以80%为宜[8]。作者只选择几个方差最大的主成分,以达到简化系统结构、抓住问题实质的目的。

2  采矿方法优选的神经网络模型

2.1  神经网络的基本原理及拓扑结构

BP算法由数据流的前向计算(正向传播)和误差信号的反向传播2个过程构成。正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元[9-10]。若在输出层得不到期望的输出,则转向误差信号的反向传播流程。通过这2个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程[11],如图3所示。

图3  3层BP神经网络拓扑结构

Fig.3  Topological structure of three layers BP neural networks

2.2  BP神经网络模型的训练算法

为了保证网络的收敛性和高效性,必须对输入样本进行归一预处理。训练过程为:给网络提供输入-输出样本对,通过不断地训练该网络,使其调整、修正网络上各神经元的权值和阈值。对于给定训练样本的输入,若网络的输出能准确地逼近给定训练样本的输出时,则该网络完成了训练过程。在训练过程中,不断修正网络权值和阈值的规则称为训练算法[12]。本文采用的是在有训练者指导下,建立在梯度下降法基础上的反向传播算法。设给定N个样本对(Xk,Yk)(k=1, 2, …, N),对于第l层的第j个单元,当输入第k个样本时,节点j的输入为:

             (6)

式中:为权值;为l-1层输入第k个样本时,第j个单元节点的输出。其中,输出节点,转换函数?采用Sigmoid函数:

              (7)

误差函数为:

          (8)

式中:为单元j的实际输出。总误差为:

              (9)

。算法步骤如下:

Step1  任意选取权系数初值。

Step2  重复下述过程直到E<ε为止(ε为给定精度)。

(1)     对于k=1, …, N,

正向过程计算:计算每层各单元的

反向过程计算:对隐含层各单元,计算

(2) 修正权值:

,0<μ<1         (10)

              (11)

3  主成分分析法与BP神经网络结合在采矿方法优选中的应用

将神经网络和主成分分析方法相结合,建立预测模型,目的是首先应用主成分分析方法去除原始样本数据间的相关性,删除其中的部分冗余信息,以降低数据的维数,得到主成分。用得到的主成分作为网络的输入神经元,减少网络输入层的节点数,建立网络模型,见图4。

3.1  SPSS软件简介

SPSS for Windows是在SPSS/PC(for DOS)基础上发展起来的,名为“社会科学用统计软件包”。它是一个组合式软件包,集数据处理、分析功能于一身。该分析方法丰富,提供了从简单描述统计分析到多因素分析统计分析方法。

3.2  相关性分析

利用SPSS软件包进行相关性分析。原始变量输入因素[13]为:走向长度、厚度、倾角、矿体稳固性、

图4  主成分分析与神经网络结合采矿方法优选模型

Fig.4  Optimization of mining methods based on combination of principal component analysis and neural networks

上盘稳固性、下盘稳固性、采场生产能力、采矿功效、损失率、贫化率采和矿成本。输出因素为:采矿方法。某矿开采条件及技术经济指标、采矿方法见表1。相关系数采用Pearson,即皮尔逊相关。显著性检验采用Two-tailed即双尾T检验。各指标的Pearson相关系数矩阵见表2。

从表2可以看出:输入因素中彼此有几个因素具有明显的相关性,这必定会对BP神经网络预测模型精度造成影响。因此,有必要对输入数据进行主成分分析。


3.3  数据的预处理

由于采矿方法优选数据量纲和数据级的不同,使得数据之间的差异比较大,因此,在进行主成分分析之前,要利用式(4)对数据进行标准化处理[14]

3.4  主成分分析

利用SPSS中的主成分分析功能对表1中的数据进行分析。其参数选取为:主成分列表;主成分碎石图和主成分分析矩阵模型等。

从图5所示主成分碎石图可以看出:因子1与2、因子2与3、因子3与4的特征值之差比较大,相对而言其他因子之间的特征值差值较小,可以初步得出提取前4个因子能概括绝大部分信息。

表3所示为各成分方差贡献率及累计贡献率。从表3可知:前4个成分解释总变异的80%左右,符合主成分方差占总方差75%~85%的要求[15],所以,可以概括原始变量。同时与碎石图显示的信息相吻合。

主成分因子荷载矩阵见表4。据表4中主成分分析矩阵模型,给出因子Y1,Y2,Y3和Y4与原始变量之间的关系,根据该矩阵写出因子表达式:

Y1=-0.352X1+0.799X2-0.417X3+0.718X4+0.712X5+0.64X6+0.747X7+0.523X8+0.142X9+0.503X10+0.388X11


表1 某矿开采条件及技术经济指标、采矿方法统计

Table 1  Statistical data of mining condition, technical and economic index and mining method of a certain mine

表2  各指标的Pearson 相关系数矩阵

Table 2  Pearson correlation coefficient matrix of each index

图5  主成分分析碎石图

Fig.5  Scree plot of principal component analysis

表3  Y1~Y4各成分方差贡献率及累计贡献率

Table 3  Contribution rate and cumulating contribution rate of each component variance from Y1-Y4

Y2=0.403X1+0.378X2-0.080X3+0.549X4+0.525X5+0.619X6+0.405X7+0.286X8+0.205X9+0.660X10+0.177X11

Y3=-0.764X1-0.121X2+0.742X3+0.260X4+0.297X5+0.047X6+0.185X7+0.175X8+0.116X9+0.114X10+0.527X11

Y4=0.242X1+0.115X2-0.358X3+0.080X4+0.225X5+0.153X6+0.166X7-0.246X8+0.781X9-0.236X10+0.585X11

根据上述表达式对3.2节中标准化后的数据进行主成分分析计算,计算后的部分数据见表5。

3.5  BP模型的设计、训练与预测

考虑到现有利用BP网络对采矿方法进行优选的方法中存在输入数据相关、输入数据过多的缺陷,采用BP网络与主成分分析法结合对采矿方法进行优   选。利用第2部分的网络拓扑结构Y1,Y2,Y3和Y4作为输入因素,采矿方法编号作为输出因素。同时,把表5中的数据分成2个样本子集:训练样本子集(1~12)和预测样本子集(13~15)。在建模过程中有关参数选取为:学习率0.9,冲量系数0.7,通过训练最终确定最佳网络结构为4个输入节点、11个隐层节点和1个输出节点。预测结果见表6。由表6可知:实际输

表4  主成分因子荷载矩阵

Table 4  Factor load matrix of principal component

表5  主成分计算后的部分数据

Table 5  Partial calculated data of principal component

表6  BP网络预测与PCA-BP网络预测结果对比

Table 6  Comparison between BP network predicted results and PCA-BP network predicted results

出与预期输出的相对误差都控制在5%以内,说明经过训练后的神经网络模型具有较高的预测精度。

参考文献:

[1] 王启明. 非煤矿山安全生产形势、问题及对策[J]. 金属矿山, 2005, 352(10): 1-6.
WANG Qi-ming. Situation of safety production in non-coal mines and its problems and countermeasures[J]. Metal Mine, 2005, 352(10): 1-6.

[2] 古德生. 地下金属矿采矿科学技术的发展趋势[J]. 黄金, 2004, 25(1): 18-22.
GU De-sheng. The science & technology development of underground mental mining[J]. Gold, 2004, 25(1): 18-22.

[3] 周科平. 地下金属矿山采矿方法的智能选择[J]. 中国有色金属学报, 1998, 8(2): 673-676.
ZHOU Ke-ping. The intelligent choice of underground metal mining methods[J]. Transactions Nonferrous Metals Society of China, 1998, 8(2): 673-676.

[4] 古德生, 周科平. 信息扩散原理和神经网络在采矿方法选择中的应用[J]. 中国矿业, 2000, 9(4): 82-86.
GU De-sheng, ZHOU Ke-ping. Applying the information spreading and neural network to choose mining methods[J]. China Mining Magazine, 2000, 9(4): 82-86.

[5] TANG Wan-mei. The study of the optimal structure of BP neural network[J]. System Engineering Theory and Practice, 2005, 25(10): 95-100.

[6] 林杰斌, 刘明德. SPSS10.0与统计模式建构[M]. 北京: 人民统计出版社, 2001: 185-190.
LIN Jie-bing, LIU Ming-de. SPSS10.0 and construction of statistics model[M]. Beijing: China Statistics Press, 2001: 185-190.

[7] 李英龙, 严碧. SPSS统计软件包在矿山统计分析中的应用[J]. 黄金, 2000, 21(5): 17-20.
LI Ying-long, YAN Bi. The application of SPSS in mine statistical analysis[J]. Gold, 2000, 21(5): 17-20.

[8] 王淑红, 李英龙, 戈保梁. 主成分分析法与神经网络在选矿建模中的应用[J]. 有色矿冶, 2001, 17(6): 25-28.
WANG Shu-hong, LI Ying-long, GE Bao-liang. Application of principal component analysis and neural network model in mineral processing[J]. Non-ferrous Mining and Metallurgy, 2001, 17(6): 25-28.

[9] 叶双峰. 关于主成分分析做综合评价的改进[J]. 数理统计与管理, 2001, 20(2): 52-56.
YE Shuang-feng. Application and consideration about principal component analysis[J]. Application of Statistics and Management, 2001, 20(2): 52-56.

[10] Deduth H, Beatle M. Neural network toolbox for use with MATLAB[M]. MA: The Math Works Inc, 2001: 118-130.

[11] 闻新. MATLAB神经网络仿真与应用[M]. 北京: 科学出版社, 2003: 278-283.
WEN Xing. Neural network simulation and application based on MATLAB[M]. Beijing: Science Press, 2003: 278-283.

[12] 伍春香, 刘琳. 三层BP网络隐层节点数确定方法的研究[J]. 武汉测绘科技大学学报, 1999, 24(2): 177-178.
WU Chun-xiang, LIU Lin. Study on the method of determining of hidden layer’s nodes for three-layer network[J]. Journal of Wuhan Technical University of Surveying and Mapping, 1999, 24(2): 177-178.

[13] 吴爱祥, 郭立, 余键, 等. 采矿方法模糊优选的神经网络模型构造及其应用[J]. 矿冶工程, 2003, 23(3): 6-11.
WU Ai-xiang, GUO Li, YU Jian, et al. Neural network model construction and its application in fuzzily optimization of mining method[J]. Mining and Metallurgical Engineering, 2003, 23(3): 6-11.

[14] 徐小荷, 廖国华, 马光, 等. 采矿手册: 第2卷[M]. 北京: 冶金工业出版社, 1990: 479-506.
XU Xiao-he, LIAO Guo-hua, MA Guang, et al. Mining manual: Vol.2[M]. Beijing: Metallurgical Industry Press, 1990: 479-506.

[15] 徐自祥, 周德云. 基于主成分的模糊神经网络[J]. 计算机工程与应用, 2006, 42(5): 34-36.
XU Zi-xiang, ZHOU De-yun. Fuzzy neural network based on principal component[J]. Computer Engineering and Applications, 2006, 42(5): 34-36.

(编辑 陈爱华)

收稿日期:2010-02-23;修回日期:2010-05-08

基金项目:国家自然科学基金资助项目(50774092);全国优秀博士学位论文专项基金资助项目(200449)

通信作者:陈建宏(1963-),男,江苏苏州人,博士,教授,博士生导师,从事矿山与安全系统工程研究;电话:0731-88877859;E-mail: cjh@263.net

[1] 王启明. 非煤矿山安全生产形势、问题及对策[J]. 金属矿山, 2005, 352(10): 1-6.WANG Qi-ming. Situation of safety production in non-coal mines and its problems and countermeasures[J]. Metal Mine, 2005, 352(10): 1-6.

[2] 古德生. 地下金属矿采矿科学技术的发展趋势[J]. 黄金, 2004, 25(1): 18-22.GU De-sheng. The science & technology development of underground mental mining[J]. Gold, 2004, 25(1): 18-22.

[3] 周科平. 地下金属矿山采矿方法的智能选择[J]. 中国有色金属学报, 1998, 8(2): 673-676.ZHOU Ke-ping. The intelligent choice of underground metal mining methods[J]. Transactions Nonferrous Metals Society of China, 1998, 8(2): 673-676.

[4] 古德生, 周科平. 信息扩散原理和神经网络在采矿方法选择中的应用[J]. 中国矿业, 2000, 9(4): 82-86.GU De-sheng, ZHOU Ke-ping. Applying the information spreading and neural network to choose mining methods[J]. China Mining Magazine, 2000, 9(4): 82-86.

[5] TANG Wan-mei. The study of the optimal structure of BP neural network[J]. System Engineering Theory and Practice, 2005, 25(10): 95-100.

[6] 林杰斌, 刘明德. SPSS10.0与统计模式建构[M]. 北京: 人民统计出版社, 2001: 185-190.LIN Jie-bing, LIU Ming-de. SPSS10.0 and construction of statistics model[M]. Beijing: China Statistics Press, 2001: 185-190.

[7] 李英龙, 严碧. SPSS统计软件包在矿山统计分析中的应用[J]. 黄金, 2000, 21(5): 17-20.LI Ying-long, YAN Bi. The application of SPSS in mine statistical analysis[J]. Gold, 2000, 21(5): 17-20.

[8] 王淑红, 李英龙, 戈保梁. 主成分分析法与神经网络在选矿建模中的应用[J]. 有色矿冶, 2001, 17(6): 25-28.WANG Shu-hong, LI Ying-long, GE Bao-liang. Application of principal component analysis and neural network model in mineral processing[J]. Non-ferrous Mining and Metallurgy, 2001, 17(6): 25-28.

[9] 叶双峰. 关于主成分分析做综合评价的改进[J]. 数理统计与管理, 2001, 20(2): 52-56.YE Shuang-feng. Application and consideration about principal component analysis[J]. Application of Statistics and Management, 2001, 20(2): 52-56.

[10] Deduth H, Beatle M. Neural network toolbox for use with MATLAB[M]. MA: The Math Works Inc, 2001: 118-130.

[11] 闻新. MATLAB神经网络仿真与应用[M]. 北京: 科学出版社, 2003: 278-283.WEN Xing. Neural network simulation and application based on MATLAB[M]. Beijing: Science Press, 2003: 278-283.

[12] 伍春香, 刘琳. 三层BP网络隐层节点数确定方法的研究[J]. 武汉测绘科技大学学报, 1999, 24(2): 177-178.WU Chun-xiang, LIU Lin. Study on the method of determining of hidden layer’s nodes for three-layer network[J]. Journal of Wuhan Technical University of Surveying and Mapping, 1999, 24(2): 177-178.

[13] 吴爱祥, 郭立, 余键, 等. 采矿方法模糊优选的神经网络模型构造及其应用[J]. 矿冶工程, 2003, 23(3): 6-11.WU Ai-xiang, GUO Li, YU Jian, et al. Neural network model construction and its application in fuzzily optimization of mining method[J]. Mining and Metallurgical Engineering, 2003, 23(3): 6-11.

[14] 徐小荷, 廖国华, 马光, 等. 采矿手册: 第2卷[M]. 北京: 冶金工业出版社, 1990: 479-506.XU Xiao-he, LIAO Guo-hua, MA Guang, et al. Mining manual: Vol.2[M]. Beijing: Metallurgical Industry Press, 1990: 479-506.

[15] 徐自祥, 周德云. 基于主成分的模糊神经网络[J]. 计算机工程与应用, 2006, 42(5): 34-36.XU Zi-xiang, ZHOU De-yun. Fuzzy neural network based on principal component[J]. Computer Engineering and Applications, 2006, 42(5): 34-36.