基于云理论与加权马尔可夫模型的矿井涌水量预测
谢道文1,2,施式亮1,3
(1. 中南大学 资源与安全工程学院,湖南 长沙,410083;
2. 湖南科技大学 信息与电气工程学院,湖南 湘潭,411201;
3. 湖南科技大学 能源与安全工程学院,湖南 湘潭,411201)
摘要:针对矿井涌水量预测问题,提出一种新的既考虑模糊性又考虑随机性的云加权马尔可夫预测模型。其过程为:首先,利用云理论对矿井涌水量状态概念进行云划分,通过X条件云发生器确定训练样本各年份涌水量所属状态;由于云模型具有模糊和随机特性,同一样本属性值通过X条件云发生器时,输出不同的状态,从而形成不同情形下的马尔可夫状态空间,为此,根据各种情形出现的频数,确定各自的权重。然后,应用加权马尔可夫预测法,计算各种情形下预测样本所属状态的概率矩阵,加权求和得到最终的预测概率矩阵,并根据最大隶属度原则,确定预测样本所属状态。最后,以河南鹤壁四矿1982—1999 年的矿井涌水量时间序列作为训练样本,采用所建立的云加权马尔可夫预测模型,对2000—2001年的矿井涌水量所属状态进行预测,研究结果表明:2000年和2001年的涌水量预测状态同为状态5,属涌水量较少年份,与其实际状态相一致。
关键词:云模型;加权马尔可夫;矿井涌水量
中图分类号:TD742.1 文献标志码:A 文章编号:1672-7207(2012)06-2308-08
Mine water inrush prediction based on cloud model theory and Markov model
XIE Dao-wen1,2, SHI Shi-liang1,3
(1. School of Resources and Safety Engineering, Central South University, Changsha 410083, China;
2. School of Information and Electrical Engineering, Hunan University of Science & Technology, Xiangtan 411201, China;
3. School of Mining and Safety Engineering, Hunan University of Science & Technology, Xiangtan 411201, China)
Abstract: A new model was proposed to predict the mine water inrush considering the randomness and fuzziness called cloud-weighed Markov model. Firstly, cloud model theory was used to classify the state concept of mine water inrush. Then the X-term cloud generation was used to gain the state of every training sample according to great determination method. Due to randomness and fuzziness of cloud model, output state of every training sample may be different, but belongs to no more than two ones, different state spaces of Markov chain were developed for every situation. After a certain number of simulations, different occurrence probabilities of different state spaces were regarded as the weight to calculate the final prediction probabilities. According to the final prediction probabilities, state of sample for prediction was determined by the principle of maximum membership. Finally, the mine water inrush of the 4th Mine in Hebi in the years from 1982 to 1999 was taken as training samples of time series and the water inrush in 2000-2001 was forecasted with the established model. The results show that states of prediction in 2000-2001 are both state 5, which coincide with their real states, and the two years belongs to less water inrush years.
Key words: cloud model; weighted Markov; mine water inrush
近年来,煤矿水害事故、突水淹井、淹采区和重大未遂水害事故多发,并有逐步上升的趋势[1],造成重大人员伤亡和财产损失。为吸取事故教训,防治水害事故,加强煤矿安全生产工作、开展突水预测预报研究工作显得尤为重要,其中对矿井涌水量进行准确的预测是一项必要的研究措施。目前,矿井涌水量预测大体上可以分为确定性分析方法和不确定性(随机)分析方法2类[2]。黄存捍等[3]将时间序列最小嵌入维数作为支持向量机的输入节点,并据此建立矿井涌水量预测模型;鲍道亮等[4]应用灰色系统理论,建立 GM(1,1)灰色预测模型,对煤矿涌水量进行动态预测;姜素等[5-7]采用神经网络方法建立了预测模型;陈玉华等[8]则采用混沌时间序列分析方法对矿井涌水量进行了预测。以上各种方法原理不同,结果表示方式不一,各有其优缺点和最佳应用环境。矿井涌水受许多不确定性因素影响,而且矿井涌水的数量也存在大量的不确定性,而模糊性和随机性是不确定性最基本的2个方面。李德仁等[9]提出的云模型是一种不确定定量定性互换模型,它把不确定概念的模糊性和随机性有机地结合在一起,实现了不确定语言值与定量数值之间的自然转换。以往的研究常常把不确定的两方面割裂开来。近年来,马尔可夫链的理论和方法广泛地应用于径流、电力、经济等领域的预测研究,并取得很好的效果,但是,对矿井涌水量的预测尚未涉及。为此,本文作者应用云理论和加权马尔可夫预测法建立云加权马尔可夫预测模型(C-WMM),用于矿井涌水量的定性预测。
1 云理论
1.1 云理论简介
云是利用语言值表示某个定性概念与其定量表示之间不确定性转换模型, 它主要反映自然语言中概念的2种不确定性, 即模糊性(边界的亦此亦彼性)和随机性(发生的概率),并把两者完全集成在一起,构成定性和定量间的映射。
设U是一个用精确数据值表示的定量论域,,T是U空间上的定性概念。若元素x()对T的隶属的确定度是1个有稳定倾向的随机数(式1),则概念T从论域U到到区间[0,1]的映射在数域空间的分布称为云(Cloud)。每个x称为1个云滴(x,CT(x)),云就是由许许多多这样的云滴构成的[9]。
(1)
云模型有多种形式,有Γ云、梯形云、正态云和三角云等。正态云模型是基本的云模型,是表征语言原子的有力工具之一。在正态云模型的基础上,增加某个或某些参数,根据不同的用途可以生产不同的形态的云模型,有左升云、左降云、右升云和右降云等。
云的数字特性反映了定性概念的定量特征,用期望Ex、熵En 和超熵He 来表征[9],其中:期望Ex指在论域空间中最能够代表此定性概念的点;熵En代表1个定性概念的可度量粒度和不确定性,表示定性概念的模糊度,是定性概念亦此亦彼的度量;超熵He是熵的不确定度量,间接地反映了云的厚度。
1.2 正向正态云发生器
云发生器[9](Cloud generator,简称 CG)是指被软件模块化或硬件固化了的云模型生成算法, 云发生器建立定性和定量之间的相互联系、相互依存,定性中有定量的映射关系, 定量中有定性的映射关系, 主要包括正向云发生器、逆向云发生器、X条件云发生器、Y条件云发生器。
正向云发生器是从定性到定量的映射, 其输入是云的数字特征 (Ex,En 和He)和云滴数量N,输出是N个云滴在数域空间的定量位置及每个云滴代表概念的确定度,具体算法如下。
步骤1:产生1个En为期望、He为方差的正态随机数;
步骤2:产生1个Ex 为期望、为方差的正态随机数;
步骤3:计算;
步骤4:带有确定度CT(xi)的成为数域中的一个云滴;
步骤5:重复步骤1~4,直至产生要求的N个云滴为止。
1.3 正向梯形云发生器
梯形云的数字特征可用期望值Ex1和 Ex2、熵 En1和En2、超熵He1和He2 6个变量来表征[10]。
期望值Ex1和Ex2:是概念在论域中的左右半云中隶属度为1的x,区间[Ex1,Ex2]的x是100%隶属于这个定性概念。
熵En1和En2:是表示定性概念左、右半云模糊度的度量,反映了在论域中可被这个概念所接受的数值范围。
超熵He1和He2:反映了左、右半云的云滴离散程度。超熵越大, 云滴离散度越大, 隶属度的随机性越大,云的厚度也越大。
显然, 左右半云期望曲线是1条正态型曲线。具体算法如下。
步骤1:产生1个En1为期望、He1为方差的正态随机数。
步骤2:产生1个Ex1为期望、为方差的正态随机数。
步骤3:若Ex1≤xi≤Ex2则CT(x)=1;若xi≤Ex1,则。
步骤4:产生1个En2为期望,He2为方差的正态随机数。
步骤5:产生1个Ex2为期望,为方差的正态随机数。
步骤6:若Ex1≤xi≤Ex2,则CT(x)=1;若xi≥Ex2,则。
步骤7:若Ex1≤xi≤Ex2,则CT(x)=1;若xi≤Ex1,则。
步骤8:重复步骤1~7,直至产生要求的N个云滴为止。
对于左半升梯形云与右半降梯形云,一般用Ex1和Ex2、熵En、超熵He 4个变量表征。
1.4 X条件正态云发生器
给定正态云的3个变量(Ex,En和He)和特定的x下的云发生器称为X条件正态云发生器。X条件云发生器生成的云滴位于同一条竖直线上,横坐标数值均为x,纵坐标隶属度值呈概率分布。具体算法如下[9]。
步骤1:产生1个En为期望、He为方差的正态随机数。
步骤2:计算。
步骤3:输出1个云滴。
步骤4:重复步骤1~3,直至产生要求的N个云滴为止。
1.5 X条件梯形云发生器
以左半升梯形云与右半降梯形云为例,来讨论X条件梯形云发生器的算法。给定左半升梯形云或右半降梯形云的4个变量(Ex1,Ex2,En,He)和特定的x条件下的梯形云发生器称为相应的X条件梯形云发生器。X条件左半升梯形云发生器的具体算法如下。
步骤1:若Ex1≤x≤Ex2,则CT(x)=1。
步骤2:若x≥Ex2,则产生1个的正态随机数。其中:En为期望,He为方差;并计算CT(x),;
步骤3:输出1个云滴drop(x,CT(x))。
步骤4:重复步骤1~3,直至产生N个云滴为止。
而X条件右半降梯形云发生器的算法与左半升梯形云的大致相同,只需把步骤2改为:若x≤Ex1,则产生1个正态随机数。并计算CT(x),。
以上各算法都使用MATLAB软件实现。
2 加权马尔可夫预测法
2.1 马尔可夫链
在事物的发展过程中,若每次状态的转移都仅与现在时刻的状态有关,而与过去的状态无关,或者说,事物的状态的“过去”与“将来”是无关的,两者是相互独立的,这样的状态转移过程就称为马尔可夫过程(Markov process)。严格的定义如下[11]。
随机变量序列为一随机序列,其中T={0,1,2,…,N},空间状态为E={1,2,…,K}。若对任意的t≥0及状态j,i0,i1,…,it-1,,都有:
则称为马尔可夫链,简称马氏链。定义表明:系统在t+s时刻的状态只与t时刻的状态有关,而与t时刻以前的状态无关,这个性质就是马氏性。因为本文应用马尔可夫链的目的是对系统未来的状态进行预测,故这里介绍的概念都限定在预测理论的框架中,即假定的状态空间是有限的,而且马氏链是齐次的。
2.2 加权马尔可夫链预测法
加权马尔可夫链预测[12]是对叠加马尔可夫链预测法进行改进,在叠加马尔可夫链的基础上,对不同的预测值赋予1个权值,再进行加权求和。一般确定系数的方法是通过对观测数据进行自相关分析。对于观测序列,若序列的n阶自相关系数越大,则说明n步的概率转移矩阵所描述的系统状态变化就越稳定、可靠,可以赋予较大的权重。
在加权马尔可夫链预测法中,通过已知样本序列x1,x2,…,xn,预测n+1时刻的状态;可利用xn,xn-1,…,xn-k+1,时刻的状态作为初始状态,计算步长为1,2,…,k时的马氏链预测值,再把所得的预测值加权求和,找出最大值所对应的状态即为所求的第n+1时刻的状态。
各步长马氏链预测值的权重通过观测数据序列的各阶自相关系数而求得。各步长的自相关系数ρs,可由下式求得:
(2)
式中:ρs为第s阶的自相关系数;s=1,2,…,k;xl为l时刻的观测值;为样本序列的均值。根据式(3),对各阶自相关系数进行规范化处理。
(3)
最后可利用ws作为s步概率转移矩阵预测结果的权系数,再将同一状态的各预测概率加权和作为最终的预测概率,即
则所对应的j即为该时刻指标值的预测状态。
3 云加权马尔可夫预测模型的建立
云加权马尔可夫预测模型(C-WMM)的建立步骤如下。
(1) 划分状态概念的云,确定划分状态的数量及区间。建立各状态概念云模型,实现定量到定性概念的转换。对于边界状态概念,一般采用左半升梯形云与右半降梯形,中间状态采用正态云模型来描述。
(2) 确定马尔可夫状态空间及权重。确定样本序列所对应的状态概念。将各年份的矿井涌水量作为Ex输入X条件云发生器,获得对各个状态概念的隶属度;根据极大判定法思想[13](如图1所示),确定涌水量的状态等级,即涌水量的状态等级属于输出最大隶属度的X条件云发生器所对应的状态概念。由于存在随机性,在重叠区中同一属性值在不同情况下可能会分配给不同的云,但最多分配给2朵不同的云,这与人类认知分类情况显然是吻合的。若有n个样本出现2种不同的状态输出,则共有2n中不同情形的马尔可夫状态空间。进行多次模拟,把不同情形出现的概率作为权重,以加权求和计算最终的预测概率。
(3) 计算各步长的马尔可夫链转移矩阵。不同的状态空间对应不同的马尔可夫链转移矩阵。分别计算不同状态空间下各步长的马尔可夫链转移矩阵。
(4) 计算各步长的权重。根据式(2)和(3)计算各阶自相关系数和各种步长的马尔可夫链权重。
图1 极大判定法原理图
Fig.1 Schematic diagram of great determination method
(5) 计算预测样本的状态在各种情形下的预测概率矩阵。
(6) 计算最终的预测概率矩阵,并进行状态预测。
对各情形下预测概率加权求和即得到最终的预测概率。最大概率所对应的状态就是预测样本所对应的状态。
4 预测实例
下面以文献[3]中鹤壁四矿1982—1999年矿井涌水量为例,如表1所示。应用云加权马尔可夫模型对2000—2001年的矿井涌水量状态进行定性预测,具体的预测步骤如下。
(1) 划分状态概念。由表1可计算鹤壁四矿历年矿井涌水量序列均值=1 351.3,均方差x=593.5。利用样本均值-方差分级法,所得分级标准见表2。将年矿井涌水量划分为5个状态,此划分属于“硬划分”。并以此为基础,应用云理论建立状态概念的云模型,实现状态概念的“软划分”。
分别对涌水量的5个状态进行状态概念的云划分,状态1对应左半升梯形云,状态2~4对应正态云,状态5对应右半降梯形云,如图2所示,分别表示为: C1(2 146.4,2348,67.2,2),C2(1 769.4,49.5,2),C3(1 351.3,98.9,2),C4(906.2,49.5,2),C5(538.2,648,36.6,2)。
(2) 确立状态空间及权重。在本研究中,1982年巷道涌水量状态在通过X条件云发生器输出时,出现2种随机输出,即状态4和状态5。在样本均值-方差分级标准中,状态4和状态5的分界阀值为757.8 m3/h,而1982年巷道涌水量为758 m3/h,若采用“硬划分”,则应属于状态4。由于存在模糊性和随机性,这种亦此亦彼特性,比“硬划分”的非此亦彼更科学、合理,更加符合人类的思维。由于其他年份的巷道涌水量与硬划分状态的分界阀值有一定的差距,所以,在通过X条件云发生器输出时,状态也是基本确定的,见表1。本文把1982年巷道涌水量状态为4的情形称为情形1,状态为5的情形称为情形2。
表1 鹤壁四矿历年矿井涌水量及其状态(情形1)
Table 1 Historical mine water inrush of the 4th mine in Hebi (Case 1) m3/h
表2 矿井涌水量状态分级表
Table 2 State grading table of mine water inrush
以1 000次为1组进行模拟,出现情形1的频率为612,出现情形2的频率为388。虽然每组模拟实验出现的结果不同,但结果趋近于情形1的频率大约为600,情形2的频率大约为400,本文取[0.6,0.4]作为它们的权重。
图2 状态等级概念的云划分
Fig.2 State concept partition based on cloud theory
(3) 计算马尔可夫链的转移矩阵。根据切普曼-柯尔莫哥洛夫方程[14],经计算可得情形1各步长的马尔可夫链的转移概率矩阵如下:
情形2各步长的马尔可夫链的转移概率矩阵如下:
(4) 计算权重。根据式(2)计算可得各阶自相关系数和各种步长的马尔可夫链权重,如表3所示。
(5) 计算预测值在各种情形下的预测概率矩阵,结果见表4。由表4可知对于情形1,2000年鹤壁四矿矿井巷道涌水量预测值所属各状态的概率矩阵为:
[0.205 1 0 0.143 9 0.280 2 0.370 7]
2000年情形2矿井涌水量状态预测结果,见表5。由表5可知情形2所属各状态的概率矩阵为:
[0.205 1 0 0.095 9 0.300 4 0.398 5]
表3 各阶自相关系数和各步长的马尔可夫链权重
Table 3 Self-correlation coefficients and weight for each step’s Markov chain
(6) 计算最终预测概率矩阵,并进行预测。2000年鹤壁四矿矿井巷道涌水量预测值所属概率矩阵为:
根据最大隶书度原则,2000年鹤壁四矿矿井巷道涌水量的预测状态为5,而2000年实际的涌水量为578.8 m3/h,通过X条件云发生器输出的状态也为5,预测状态与实际相符。再利用2000年鹤壁四矿矿井巷道涌水量的预测状态预测2001年的状态,结果见表6和表7。
由表6和表7,同理可得2001年鹤壁四矿矿井巷道涌水量的所属各状态的概率矩阵分别为:
[0.226 4 0 0.207 7 0.280 2 0.285 6]
[0.205 1 0 0.138 5 0.300 4 0.355 9]
同理,2001年鹤壁四矿矿井巷道涌水量预测值所属概率矩阵为:
表4 2000年情形1的矿井涌水量状态预测
Table 4 State prediction of mine water inrush in 2000 for Case 1
表5 2000年情形2矿井涌水量状态预测
Table 5 State prediction of mine water inrush in 2000 for Case 2
表6 2001年情形1矿井涌水量状态预测
Table 6 State prediction of mine water inrush in 2001 for Case 1
表7 2001年情形2矿井涌水量状态预测
Table 7 State prediction of mine water inrush in 2001 for Case 2
所以,2001年鹤壁四矿矿井涌水量预测状态也为5。而2001年涌水量为496.3 m3/h,属于状态5的概念划分。预测状态与实际状态相符。
5 结论
(1) 建立云加权马尔可夫预测模型,并应用其对多年矿井涌水量进行预测,预测值所属状态与实际值相吻合,为实际生产中预防矿井突水事故的发生提供了一个新思路。这种预测是定性预测,而不是具体值;划分的状态越多,预测结果越接近实际值。
(2) 应用云理论对状态概念进行“软划分”,综合考虑模糊性和随机性,摒弃了非此亦彼的“硬划分”。
(3) 由于云模型的随机性,每次各情形出现的次数虽不同,但具有一定的趋势,并不影响最后的预测结果。
参考文献:
[1] 张正浩. 煤矿水害防治技术[M]. 北京: 煤炭工业出版社, 2010: 112.
ZHANG Zheng-hao. Water hazards prevention and control technology in coal mine[M]. Beijing: China Coal Industry Publishing House, 2010: 112.
[2] 杜敏铭, 邓英尔, 许模. 矿井涌水量预测方法综述[J]. 四川地质学报, 2009, 29(1): 70-73.
DU Min-ming, DENG Ying-er, XU Mo. Review of methodology for prediction of water yield of mine[J]. Acta Geologica Sichuan, 2009, 29(1): 70-73.
[3] 黄存捍, 冯涛, 王卫军, 等. 基于分形和支持向量机矿井涌水量的预测[J]. 煤炭学报, 2010, 35(5): 806-810.
HUANG Cun-han, FENG Tao, WANG Wei-jun, et al. Mine water inrush prediction based on fractal and support vector machines[J]. Journal of China Coal Society, 2010, 35(5): 806-810.
[4] 鲍道亮, 刘宏锦. 基于GM(1,1)模型的矿井涌水量预测[J]. 龙岩学院学报, 2010, 28(2): 32-34.
BAO Dao-liang, LIU Hong-jin. Prediction of water discharge based on GM (1,1) model[J]. Journal of Longyan University, 2010, 28(2): 32-34.
[5] 姜素, 孙亚军, 杨兰, 等. 基于BP神经网络方法的矿井涌水量预测[J]. 中国煤田地质, 2007, 19(2): 38-40.
JIANG Su, SUN Ya-jun, YANG Lan, et al. Mine inrush water prediction based on BP neural network method[J]. Coal Geology of China, 2007, 19(2): 38-40.
[6] 梁冰, 李刚, 王宗林. 基于BP神经网络的降雨充水矿井涌水量预测[J]. 中国地质灾害与防治学报, 2009, 20(1): 122-125.
LIANG Bing, LI Gang, WANG Zong-lin. Prediction of water inflow of mine with rainfall yield based on BP artificial neural network[J]. The Chinese Journal of Geological Hazard and Control, 2009, 20(1): 122-125.
[7] 吴翠娟. 基于神经网络的矿井涌水量预测研究[J]. 中国煤炭, 2009, 35(10): 105-107.
WU Cui-juan. A study on the nervous network based mine water inflow forecasts[J]. China Coal, 2009, 35(10): 105-107.
[8] 陈玉华, 杨永国, 彭高辉. 矿井涌水量混沌时间序列分析与预测[J]. 煤田地质与勘探, 2008, 36(4): 34-36.
CHEN Yu-hua, YANG Yong-guo, PENG Gao-hui. Chaotic time series analysis and prediction for mine water inflow[J]. Coal Geology & Exploration, 2008, 36(4): 34-36.
[9] 李德仁, 王树良, 李德毅. 空间数据挖掘理论与应用[M]. 北京: 科学出版社, 2006: 337-349.
LI De-ren, WANG Shu-liang, LI De-yi. Spatial data mining theories and applications[M]. Beijing: Science Press, 2006: 337-349.
[10] 王兆红. 基于梯形云的数量型关联规则挖掘方法[J]. 信息技术与信息化, 2005(6): 98-100.
WANG Zhao-hong. Quantitative association rules mining method based on trapezium-cloud model[J]. Shandong Electronics, 2005(6): 98-100.
[11] 郑小平, 高金吉, 刘梦婷. 事故预测理论与方法[M]. 北京: 清华大学出版社, 2009: 165-170.
ZHENG Xiao-ping, GAO Jin-ji, LIU Meng-ting. Theories and methods of accident prediction[M]. Beijing: Tsinghua University Press, 2009: 165-170.
[12] 夏乐天. 梅雨强度的指数权马尔可夫链预测[J]. 水利学报, 2005, 36(8): 988-993.
XIA Le-tian. Prediction of plum rain intensity based on index weighted Markov Chain[J]. Journal of Hydraulic Engineering, 2005, 36(8): 988-993.
[13] 李德毅, 杜鹢. 不确定性人工智能[M]. 北京: 国防工业出版社, 2005: 229-230.
LI De-yi, DU Yi. Artificial intelligence with uncertainty[M]. Beijing: National Defence Industry Press, 2005: 229-230.
[14] 蒋承仪. 灰色马尔柯夫预测模型[J]. 重庆建筑大学学报, 1996, 18(3): 117-123.
JIANG Cheng- yi. Grey Markov forecasting model[J]. Journal of Chongqing Jianzhu University, 1996, 18(3): 117-123.
(编辑 陈灿华)
收稿日期:2011-07-06;修回日期:2011-09-22
基金项目:国家自然科学基金资助项目(50774033,50674046);湖南省安全生产重点项目(HN09-04)
通信作者:谢道文(1974-),男,湖南邵阳人,博士研究生,讲师,从事矿井安全评价、数据挖掘研究;电话:0731-58290926;E-mail:dwxie@hnust.edu.cn