基于快速支持向量机算法的灌浆地层识别
李凤玲1, 2,徐力生3,申群太2
(1. 长沙理工大学 汽车与机械学院,湖南 长沙,410076;
2. 中南大学 信息科学与工程学院,湖南 长沙,410083;
3. 中南大学 地学与环境工程学院,湖南 长沙,410083)
摘 要:针对灌浆地层裂隙存在不确定性变化的特点,提出基于支持向量机(SVM)的灌浆地层智能识别方法,以提高地层识别能力。为了提高支持向量机模型的运算速度,采用几何方法求取支持向量,避免了二次规划算法求解。该算法根据支持向量的几何分布特点,从距离最近的样本点开始,通过不断地寻找违反KKT条件的样本点来找出支持向量。最后,选取大理岩石(较完整地层)和砂质板岩地层的部分灌浆实验数据样本建立灌浆地层的分类模型,用其他未训练的同分布的新数据进行地层识别验证。仿真结果表明,改进支持向量机分类方法简单有效,与神经网络方法相比有更强的泛化能力和更快的运算速度。
关键词:灌浆;地层;支持向量机;分类; 几何算法
中图分类号:P631.4+9;TV543+.11 文献标识码:A 文章编号:1672-7207(2009)02-0478-06
Grouting stratum identification with fast support vector machine
LI Feng-ling1, 2, XU Li-sheng3, SHEN Qun-tai2
(1. College of Automobile and Mechanical Engineering, Changsha University of Science and Technology,
Changsha 410076, China;
2. School of Information Science and Engineering, Central South University, Changsha 410083, China;
3. School of Geology and Environmental Engineering, Central South University, Changsha 410083, China)
Abstract: A support vector machine (SVM) approach was proposed for uncertain grouting stratum to increase the grouting stratum identification capability. In order to improve SVM algorithm’s iterative efficiency, a geometric algorithm of support vector was proposed to avoid resolving quadratic programming algorithm. The principle of the new algorithm is as follows: starting from two closest points of the opposite classes to seek the support vectors accumulatively, and seeking the vectors which are the violators of KKT condition as support vectors. Finally, selecting group classification data of fracture rock and gritstone stratum in the real grouting project, a part of them was used to train set of SVM, and others were used to check the classification effect. Simulation results show that SVM method is simple and effective, and it has strong robust ability and faster computing velocity compared with neural network method.
key words: grouting; stratum; support vector machine; classification; geometric algorithm
地层与灌浆压力的设计、灌浆压力控制密切相 关[1-2]。但由于地层裂隙的几何尺寸、裂隙数、裂隙发育状况等因素的变化具有不确定性,因此,准确了解地层的性质有重要意义。常规测量岩石地层性质的方法有微分测试法、弹性模量法、P型微波法、S型微波法[3]和数字电视探测法等[4]。不同地层的灌浆压力-流量曲线有其不同的特性,并据此将地层分为5类[5]。常用的智能识别方法有神经网络(NN)法、模糊识别法和粗集不相容系统法[6]。其中,模糊识别模型高度依赖先验知识[7],而NN模型易陷入局部最优。支持向量机(SVM)是由Vapinik[8]提出的一种新型的基于统计学习理论的学习机,建立在统计学习理论的VC维理论和结构风险最小原理基础上,在小样本、高维、非线性数据空间下的学习过程中可以充分利用多种特征提供的信息,具有较强的泛化能力[9-10]。本文作者在这些研究的基础上,对灌浆系统简化模型进行分析,得出合适的地层描述特征,并通过自行研制的灌浆自动记录仪采集现场数据。然后,选用2类不同地层的分类数据,运用快速支持向量机分类(几何求解法,记为Fast-SVM),当分类模型训练好后,对新的地层特征数据进行分类;最后,将C-SVM和Fast-SVM与神经网络方法进行仿真对比。
1 支持向量机分类
1.1支持向量机的基本思想
给定l个样本(,i=1, 2, …, l),根据已知样本,寻求1个最优分类函数(超平面),能将2类数据分开,且每类数据到超平面D的最短距离之和(又称之为隔)最大。
对于2类分类问题,。数据点若属于+1类,则≥1;若属于-1类,则≤-1。这时,称数据点xi被正确分类,可以综合表示为:
≥1。 (1)
点xi到超平面D的距离可表示为,结合式(1),点到超平面D的最短距离为,隔可以表示为。要使隔最大,最优分类的问题可以表示为:
通过上述描述,最优分类问题变成空间数据点的二次最优化问题。
1.2 支持向量机模型的优化算法
从式(2)可以看出,支持向量机分类的数学模型实质是二次最优问题。引入Lagrange 乘子。根据Wolfe对偶理论,将式(2)中含不等式约束的最优问题表示为Lagrange广义目标函数形式[11]:
。 (3)
由极值条件可得:
。 (4)
。 (5)
同时,它应满足Karush-Kush-Tucker(KKT)互补 条件[12]:
将式(4)和(5)代入式(3),再结合式(6),原问题的最优对偶表达式为:
max ,
st. 。 (7)
其中:≥0;i=1, 2, …, l。
通过迭代求解式(7),获得最优的Lagrange 乘子。结合式(6)可得:
。 (8)
由于最优≥0,代入
。 (9)
联系式(8)和(9)得最优分类面为:
将测试的数据代入式(10),若D(x)≥1,则识别地层类别为+1类;若D(x)≤-1,则识别类别为-1类。
2 几何算法
2.1 几何算法原理
为了使分类算法在实际灌浆工程中具有更快的在线分类速度,采用几何算法的思想。通过从几何图形上分析支持向量的位置特点,得到最优分类超平面h完全由落在2条边界线h1和h2上的样本点确定,这样的样本点称为支持向量。落在2条边界线之间的所有样本点对最优分类超平面没有贡献。该算法根据支持向量的几何分布特点,先从距离最近的样本点开始;然后,通过不断地寻找违反KKT条件的样本点,直到找出分类超平面为止,这样,避免了式(7)的二次规划求解。
2.2 原空间几何快速算法
原空间几何快速算法的步骤为:
a. 从不同类的样本中,首先找出2个相距最近的样本点作为初始的2个支持向量。
b. 经过初始2个样本连线的中心点O0,并垂直于2个样本连线的1个超平面作为初始最优超平面。
c. 找出以此超平面为最优分类面时,违反KKT条件,且距超平面最近的数据点。
d. 将此点作为1个新的支持向量,同时,在样另类样本中找出与此点相距最近的点也作为支持向量,新的2个支持向量的中心记为O1,对原超平面以O0为支点进行旋转,再通过调整超平面的位置,使得新的超平面经过后2个支持向量连线的中心O1,再调整最优超平面参数。
e. 重复步骤c和步骤d,直到没有违反KKT互补条件为止(或达到允许最小误差为止)。
f. 当有新的训练样本加入时,只在新的样本中找出最大违反KKT条件者,重复步骤d和步骤e。
g. 对原支持向量集中所有样本支持向量的条件进行重新判断,将不符合支持向量条件的样本从原支持向量集中剔除。
h. 停止迭代。
图1所示为算法的求解过程。其中:O0为初始2个样本连线中心;O1为新支持向量连线中心点。
图1 算法的迭代过程
Fig.1 Iterative update of support vector
若在原样本空间进行非线性分类,可以将原样本空间进行特征变换,变成线性后,再用此算法求取。本文采用核函数,样本的距离公式为:
。
其余迭代算法与前面的相同。
3 灌浆地层的分类模型
3.1 灌浆地层分类数据特征选取
分类是把具有共同特征的一些条目归并在一起并把它们与不同特征的其他条目区分出来的一种方法。关于地层的分类或识别,在不同的研究领域或基于不同的应用目的,选择描述地层特征的不同,对地层分类种类也不同,如围岩稳定性分类中,选取了抗拉强度、完整性等5个指标[10]。本文地层分类是为灌浆过程中压力设计或灌浆仪压力控制服务的,所以,应根据灌浆过程中浆液的渗流机理和灌浆工艺过程需要进行分类。
灌浆压力初始设计可由岩石的深度与岩性确 定[1]:
。 (11)
其中:p为灌浆压力,MPa;h为灌浆段顶板以上的岩石厚度,m;p0和m0是与岩性有关的系数。
针对岩石地层分析不同区域地层下注浆参数特征及其变化规律。Eriksson等[10]通过实验研究发现,灌浆液的扩散与地层裂隙、浆液密度、灌浆压力、黏度等有关。灌浆液的扩散半径不同,地层吸浆流量不同。可用同一工序下地层吸浆流量、灌浆压力、密度和黏度等来描述当前灌浆状态下的地层性质。利用传感器检测灌浆液中一些重要参数来反映地层变化方法比考虑岩石地层裂隙方向、地下水位状态等机理的微观模型更科学。此地层裂隙的不确定变化可以通过灌浆液流量、灌浆压力的变化来反映。
灌浆过程中灌浆口是密封的,整个灌浆管道连同吸浆地层可看成一连通密闭容器,根据帕斯卡液压原理,调节阀的开度相当于改变液压系统的负载,也就能改变管道内部的压力。可以将此灌浆模型简化为带3个调节阀的蓄水池类似模型,如图2所示。
1—进浆阀;2—回浆阀;3—渗漏阀; 4—进水管;5—压力表; 6—橡胶塞;7—回水管
图2 灌浆系统现场简化模型
Fig.2 Simple model of grout system
以图2所示模型为研究对象,将灌浆液看成均匀稳定浆液,整个灌浆管道遵循质量守恒定律,即
以图2中返浆管道浆液为研究对象,满足下列压力平衡方程:
孔口至灌浆段间浆柱的静态压力为:
。 (14)
式中:为灌浆液密度;L为灌浆孔长度;g为重力加速度。
实际粘性液体在流动时存在阻力。为了克服阻力就要消耗一部分能量,这样,就有能量损失。在浆液流动中,能量损失主要表现为压力损失,这就是实际浆液流动的伯努利方程式中的hw项的含义。灌浆液沿着直径管道流动时产生的压力损失为[11]:
图2中的返浆流量即单位时间流过管道横截面积的流量,可定义为:
。 (16)
返浆流量可用流量计测量。由式(12)可知,在实际工程中不变,若地层裂隙变小,则导致变小,从而,将增大;若不及时调节压力阀的开度,从式(16)可知,返浆流速增大,则摩擦压力增大,最终导致灌浆压力增大。灌浆压力大于地层的临界压力将产生地层破裂。综合式(12)~(16),灌浆压力的非线性模型可表达为:
。 (17)
可见,密度、流量(即)和灌浆孔深度L是影响灌浆压力pG的重要因素。由文献[12]可知,地层裂隙大多直接影响地层吸浆量,而灌浆压力反过来又是影响地层吸浆,导致地层发生变化的一个主要因素[13]。所以,从与压力设计或灌浆过程压力调节角度看,与灌浆相关的地层模型可表示如下:
。 (18)
地层岩性如裂隙大小、风化程度存在差异[5]。采用文献[5]中透水率公式,该透水率综合了灌浆孔的灌浆压力、流量和孔长等参数。这里选取数据点xi的特征分量为2个主要影响因数,即灌浆压水实验透水率记作Ru、灌浆时地层吸浆量()。这2个特征分量就是每个数据点的1个坐标分量,记为:
。 (19)
3.2 分类步骤
a. 收集数据。针对不同地层利用数据采集系统收集数据。
b. 数据预处理。将各种不同单位的数据归一化处理,并去掉一些操作误差数据。
c. 将不同地层的样本数据利用快速支持向量机算法进行训练,将训练好的支持向量机模型作为地层的识别模型。
d. 将新数据输入训练好的支持向量机模型中,检验模型的准确性。
4 灌浆地层识别仿真
实验装置采用专利产品LJ-Ⅱ灌浆自动记录仪[14]及相应设备,工程环境为衡阳双板桥水库加固工程中的砂质板岩层地段和大理岩石(小裂隙)地段。砂(板)岩体吸浆量-透水率的拟合关系为;大理岩体吸浆量-透水率的拟合关系为。前者p-Q曲线变化很缓,后者曲线很陡,这些都表明不同地层有不同的灌浆特性。
通过灌浆记录仪进行数据采集, 并可通过RS232异步通信方式把采样数据传输给PC机作为支持向量机分类模型的原始数据。对大理岩石地层(小裂隙)和砂质板岩层Ⅰ序孔分别选取49组透水率(Ru)、灌浆时地层吸浆量()数据。并且标识大理岩石(小裂隙)地层为第1类,即;标记砂质板岩地层为第2类,即。其中,22组数据用于分类训练,其他27组数据用于检测。
仿真环境为Windows XP,利用Matlab 6.5软件仿真[15]。将原始数据进行归一化处理。采用高斯径向 基核函数转换数据点的点积,即。将原始数据空间不可分变为特征空间的线性可分。其中,是影响分类的重要参数,通过仿真实验,= 1.25较合理。
采用本文算法(Fast-SVM),C-SVM和RBF神经网络分类算法(RBF-NN)分别对相同数据进行模式识别,神经网络结构为2-10-1。砂质板岩智能识别结果见表1,大理岩小裂隙地层智能识别结果见表2。
从表1和表2可以看出,对于不同地层,采用C-SVM方法和Fast-SVM方法所得的检验误差比RBF-NN方法的小,C-SVM的最大检验误差仅为9.13%,而RBF检验误差为12.96%,采用C-SVM和Fast-SVM方法所得结果的检验精度相当,但后者的训练时间和检验时间比前者的短,Fast-SVM的最大用时仅为12.5 s,而C-SVM方法的最大用时为17.1 s。由表2可见,采用RBF-NN法的训练误差比SVM法的小,但它的检验误差明显比SVM方法的大。说明当NN模型精度较高时,训练误差小,但高精度的NN模型在处理新的噪声数据时反而出现过拟合现象。
表1 砂质板岩地层的智能识别对比
Table 1 Identification results by different methods
表2 大理岩地层的智能识别对比
Table 2 Identification results by different methods
5 结 论
a. 采用传统的弹性模量和微波测试法等只能反映出地层的地质学特性(如地层松散性,风化程度和裂隙大小等),使用时又受一些条件的制约。以灌浆压力控制为目的,建立了流体在不同地层时的机理模型,选取透水率和灌浆流量作为分类数据特征,不但反映灌浆液在不同地层中的水力学特性,而且可以推导出地层种类。
b. 仿真结果表明,C-SVM支持向量机相对神经网络智能方法用于小样本学习具有更高的训练精度和更强的泛化能力,最大检验误差仅为9.13%。
c. Fast-SVM算法用于求取支持向量超平面时,其运算速度要比传统的二次规划求解算法速度快,Fast-SVM方法的最大用时仅为12.5 s,而C-SVM为17.1 s。
参考文献:
[1] SL 62—94, 水工建筑物水泥灌浆施工技术规范[S].
SL 62—94, Hydraulic Structure Cement Grout Building Norm[S].
[2] 李奋强, 彭振斌, 王建军, 等. 超厚砂卵石地层气举反环钻探工艺[J]. 中南大学学报: 自然科学版, 2006, 37(1): 200-205.
LI Fen-qiang, PFNG Zhen-bin, WANG Jian-jun. Air-lift reverse technique in super thick sandy gravel[J]. Journal of Central South University: Science and Technology, 2006, 37(1): 200-205.
[3] Palmstrom A, Broch E. Use and misuse of rock mass classification systems with particular reference to the Q-system[J]. Tunnels and Underground Space Technology, 2006, 21(3): 575-593.
[4] 秦英译, 王川婴. 前视井下电视和数字钻孔摄像在工程中的应用[J]. 岩石力学与工程学, 2007, 26(1): 2834-2839.
Q1N Ying-yi, WANG Chuan-ying. Axial dowhole TV and digtal optial borehole image and their engineer application[J]. Chinese Journal of Rock Mechanics and Engineering, 2007, 26(1): 2834-2839.
[5] JIANG Ming, HOU Li-qiang. Application of characteristic analysis of experimential data of LU type pressurized water in grouting engineer[J]. Mineral Resources and Geology, 1998, 66(12): 269-273.
[6] 丁加明, 王永和, 丁力行. 基于粗集不相容系统的膨胀土分类规则提取[J]. 中南大学学报: 自然科学版, 2006, 37(2): 396-400.
DING Jia-ming, WANG Yong-he, DING Li-xin. Generating expansive soil classification rule based on rough sets for inconsistent decision system[J]. Journal of Central South University: Science and Technology, 2006, 37(2): 396-400.
[7] Kagiy A T, Sugeno M. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Trans Systems, Man, Cybernet, 1985, 15: 116-32.
[8] Vapinik V. The nature of statistical learning theory[M]. New York: Springer Verlag, 1995: 1-15.
[9] 赖永标, 乔春生, 刘开云, 等. 支持向量机在围岩稳定性分类中的应用[J]. 水利学报, 2006, 37(9): 1092-1096.
LAI Yong-biao, QIAO Chun-sheng, LIU Kai-yun, et al. Application of support vector machine in classification of surrounding rock stability[J]. Journal of Hydraulic Engineering, 2006, 37(9): 1092-1096.
[10] Eriksson M, Stille H, Andersson J. Numerical alculations for prediction of grout spread with account for filtration and varying aperture[J]. Underground Space Technology, 2000, 15(4): 353-364.
[11] Nygaad G, Geir N. Nonlinear model predictive control scheme for stabilizing annulus pressure during oil well drilling[J]. Process Control, 2006, 23(16): 719-732.
[12] 罗平平, 朱岳明, 赵咏梅, 等. 岩体灌浆的数值模拟[J]. 岩土工程学报, 2005, 27(8): 918-921.
LUO Ping-ping, ZHU Yue-ming, ZHAO Yong-mei, et al. Numerical simulation of grouting in rock mass[J]. Chinese Journal of Geotechnical Engineering, 2005, 27(8): 918-921.
[13] 窦向贤. 大坝基岩水泥灌浆的研究[D]. 大连: 大连理工大学土木水利学院, 2004: 23-56.
DOU Xiang-xian. Study of rock cement grouting on dam site[D]. Dalian: School of Civil and Hydraulic Engineering, Dalian University of Technology, 2004: 23-56.
[14] 彭环云, 张可能, 徐力生. 灌浆记录监测仪的关键技术[D]. 长沙: 中南大学地学与环境工程学院, 2004: 14-34.
PENG Huan-yun, ZHANG Ke-neng, XU Li-sheng. Key technologies of the automonitoring and recording of grouting parameters[D]. Changsha: School of Geology and Environmental Engineering, Central South University, 2004: 14-34.
[15] LIN Chih-jen. LIBSVM: A library for support vector machines Software[EB/OL]. http: //www. csie .ntu. edu.tw /~cjlin/ libsvm, 2006: 6.
收稿日期:2008-09-02;修回日期:2008-11-18
基金项目:湖南省教育厅科研基金资助项目(08C091)
通信作者:李凤玲(1974-),女,湖南邵东人,博士研究生,讲师,从事仪器仪表、智能计算的研究;电话:0731-2300974;E-mail: flli4789@126.com