沉降计算经验系数的Bootstrap法置信区间估计
谢桂华1,张家生2,刘荣桂1
(1. 江苏大学 土木与力学学院,江苏 镇江,212013;
2. 中南大学 土木工程学院,湖南 长沙,410075)
摘要:采用Bootstrap法推断小样本条件下的沉降计算经验系数概率特征及置信区间,以解决工程中沉降计算经验系数样本量很少,难以应用常规统计方法分析其概率分布的问题。直接对样本重抽样,根据Bootstrap样本逼近参数真实分布,并纠正Bootstrap仿真过程中出现的偏差,以获得参数的无偏置信区间。通过某客运专线路基工程实例分析,得出:采用Bootstrap法可较好地推断小样本条件下沉降计算经验系数未知参数的概率分布,获得参数的置信区间;当面荷载在40~240 kPa范围内取值时,红黏土地基的沉降计算经验系数均值随载荷的增大而减少,经验系数均值服从正态分布,置信度为95%的经验系数均值的置信区间按荷载范围依次为[0.637, 0.884],[0.637, 0.884]及[0.901, 1.165]。
关键词:沉降;经验系数;小样本;Bootstrap法;置信区间
中图分类号:TU 470 文献标志码:A 文章编号:1672-7207(2011)09-2843-05
Estimation of confidence interval of empirical coefficients in calculating foundation settlement by Bootstrap method
XIE Gui-hua1, ZHANG Jia-sheng2, LIU Rong-gui1
(1. School of Civil Engineering and Mechanics, Jiangsu University, Zhenjiang 212013, China;
2. School of Civil Engineering, Central South University, Changsha 410075, China)
Abstract: Because of the scarcity of samples in engineering and the difficulty in inferring the probabilistic distribution of empirical coefficient by regular methods during the calculation of foundation settlement, the probabilistic distribution and confidence interval of empirical coefficient were determined by Bootstrap method. By re-sampling from the existing samples, the true distributions of parameters were approximated by Bootstrap method and the possible deviation was corrected. As a result, unbiased confidence interval estimation was obtained. A subgrade of a passenger dedicated railway was given to illustrate the proposed method and the results show that, under the condition of small sample of empirical coefficient in calculating foundation settlement, Bootstrap method is efficient to estimate the probability distributions and confidence intervals of unknown parameters; when the range of surface load is 40-240 kPa, the empirical coefficients of foundation settlement decrease with increasing loads for red clay; the mean value of empirical coefficients obeys normal distribution, and its confidence interval is [0.637, 0.884], [0.637 0.884] and [0.901, 1.165] respectively at the confidence of 95%.
Key words: settlement; empirical coefficients; small sample; Bootstrap method; confidence interval estimation
岩土工程设计中,在计算地基沉降时主要是采用建筑地基设计规范中推荐的方法[1],然而,采用该法计算的结果与工程实际沉降量相比较,往往会出现较大的误差;而且,由于试验方法的差异、土体性质的各向异性、试验条件与地基土实际状态的差异以及计算理论的不完善,使得同一地层和区域的地基沉降理论值与实际值之间的误差呈现出较大的变异性。为使根据规范公式计算得到的地基沉降更准确地反映工程实际,需要引入地基沉降计算经验系数对理论值进行修正。如何确定具有较大随机性的沉降经验系数是地基处理中迫切需要解决的问题。理论上,通过现场测试数据与理论计算结果的比较和统计,可确定地基经验系数的概率分布。然而,由于受工程场地、原位试验条件和试验经费等的限制,经常会遇到地基沉降的测试数据太少,无法采用常规统计方法确定其分布,因此,研究小样本概率分布的统计方法,具有重要的现实意义。针对小样本的统计问题,张广文等[2]提出了2种确定岩土参数概率分布的推广Bayes公式;徐超等[3-4]运用Bayes法对岩土参数的后验分布概型和统计量进行了估计;张伟等[5]基于专家打分法融合多个先验分布获得参数概率分布;宫凤强等[6-7]借助层次分析法、多源信息融合等手段推断岩土参数概率分布;王永和等[8]等利用参数的分布区间信息,并假设其先验分布服从均匀分布,根据Bayes法推断参数分布函数。上述方法充分地利用了先验信息,但其推断过程大多建立在先验信息为大样本的前提下;而且为了得到较可靠的推断结果,现场试验样本不能太少(一般要求在10~30之间)。岩土工程实践证明:以上前提条件在岩土工程中并非总能得到满足。为了解决上述问题,本文作者尝试将一种新的计算机统计方法—— Bootstrap法[9-10]引入岩土参数推断中,结合某客运专线的现场载荷试验和室内土工试验,通过计算机仿真,推断沉降计算经验系数的概率分布规律及参数的置信区间。
1 沉降计算经验系数的Bootstrap推断
1.1 Bootstrap法简介
Bootstrap法是Efron针对于小样本的统计问题提出来的,目前在社会经济分析[11-12]、环境评估[13]和生物医学[14]等领域得到了应用。Bootstrap法基于对试验观测数据的模拟再抽样来分析不确定性,摆脱了传统统计方法对分布假定的依赖,适合于任何分布和任何感兴趣的参数估计。Bootstrap法有非参数方法和参数方法之分,由于小样本条件下的参数方法对样本质量要求较高,很难获得较好的仿真效果,故本文采用非参数Bootstrap法。
1.2 沉降计算经验系数ψs的Bootstrap法推断
设按地基规范计算得到的地基沉降值为Sj,现场实测值为Sc,则它们之间的关系可用下式表示:
(1)
式中:ψs为沉降计算经验系数,可通过大量的室内试验和现场实测资料计算得到。若通过现场试验可获得n个测定值Sci(i=1, 2, …, n);其理论计算值为Sji (i=1, 2, …, n),则可以根据下式得到ψs的n个值:
(2)
设X=(x1, x2, …, xn)=为沉降计算经验系数ψs的1个样本,其平均值μ和方差σ2的估计偏差分别为:
(3)
其中:;。
根据沉降经验系数ψs的样本分布Fn随机抽样B次获得的再生样本设为(i=1, 2, …, B),则Tn1和Tn2的Bootstrap统计量为:
(4)
其中:;。
为估计地基沉降计算经验系数ψs的概率分布置信区间,可按如下步骤进行:
(1) 试验获取样本。选取典型的试验点进行载荷试验,得地基沉降试验值Sci,i=1, 2, …, n;同时,在载荷试验点周围的影响深度范围内取原状土样进行室内试验,测得其相关物理力学性能指标,计算理论沉降值Sji(i=1, 2, …, n),然后,根据式(2)计算经验系数(i=1, 2, …, n)。
(2) 根据样本值X=(x1, x2, …, xn)= ,计算样本均值和方差S2。
(3) 对n个样本作有放回模拟再抽样:采用Monte-Carlo法随机抽出1个数据,共抽取n次,得到第1个Bootstrap样本。
(4) 按步骤(3)连续重复B次,即得到B个Bootstrap再生样本,用矩阵表示为:
(5)
计算再生样本的统计量:
其中:;i=1, 2。
(5) 根据再生样本值,构造,计算Rni的值,以Rni作为Tni的估计,得到μ和σ2的估计:, 。
(6) 求其经验分布函数和,以其代替μ和σ2的分布π(μ)和π(σ2)。
(7)采用百分位法进行参数的区间估计:将B个Bootstrap估计量按从小到大排序,则包含(i=1, 2, …, B)的区间即是的置信水平为的置信区间,即置信区间为,其中和为的经验分位数。
(8) 纠偏:由于百分位法在概率收敛性上存在的缺点,通过纠偏过程减少结果的偏差。如果出现大部分Bootstrap估计量小于(大于),就意味着Bootstrap模拟低估(高估)了,必须纠正这一偏差。令:
(6)
式中:为标准正态分布函数的反函数;为示性函数,即:
(7)
构造纠偏百分位法置信区间为。其中:;;为标准正态分布函数;为标准正态分布分位数。
2 工程实例
为研究某穿越红黏土地区的客运新专线的地基沉降变形,获得该地区内地基沉降变形的计算经验系数,选择在红黏土地区1#,2#,3#和4#工点进行载荷试验[8],测得红黏土的物理力学性质如表1所示,沉降量如表2所示,根据地基规范推荐公式,计算其理论值见表2。根据表2计算得到沉降计算经验系数样本如表3所示。
从表3可以看出:沉降计算经验系数随载荷增大而减小,且呈现较大的变异性。
考虑到目前尚未收集到沉降计算经验系数的任何先验信息,且每种荷载下的样本量太少(n=4),为获知沉降计算经验系数的概率特征,将样本按面荷载分为3组:第Ⅰ组(40~80 kPa)、第Ⅱ组(120~160 kPa)、第Ⅲ组(200~240 kPa),得3组样本值分别为:第Ⅰ组,1.16,1.15,1.07,1.41,1.10,0.73,1.10,0.89;第Ⅱ组,0.76,1.10,0.76,0.78,0.60,0.54,0.62,0.95;第Ⅲ组,0.51,0.51,0.53,0.75,0.52,0.58,0.50,0.84。分别计算3组样本的均值和方差S2为: ;,。
表1 红黏土的物理力学指标[8]
Table 1 Physico-mechanical indexes of red clay[8]
表2 现场实测与理论计算沉降量[8]
Table 2 Settlements of field observation and theoretical calculation[8] mm
表3 不同载荷下沉降计算经验系数
Table 3 Empirical coefficients for settlement with different loads
对3组样本进行Bootstrap抽样,取B=1 000,得到沉降计算经验系数的再生样本均值散点图如图1所示,均值分布直方图及拟合概率密度曲线如图2所示。根据式(3)和式(4)以及步骤(5),计算对应均值及其方差估计值如表4所示。将再生样本按升序排列,知置信度为的置信区间为,进而可按式(6)计算纠偏量,得到3组样本的Bootstrap样本均值置信区间及纠偏区间如表4所示。
图1 3组经验系数模拟均值的散点图
Fig.1 Scatter plots of empirical coefficients resulted from Bootstrap simulation
图2 3组经验系数均值分布直方图
Fig.2 Means histograms of three groups of empirical coefficients
从图1、图2和表4可以看出:沉降计算经验系数ψs随荷载的增大而减少,其均值均服从正态分 布;当面荷载为40~80 kPa时,经验系数均值服从正态分布N1(1.078 1, 0.180 72),在置信度为95%下的置信区间为[0.900 9, 1.165 1],说明荷载较小时,理论值与实测值基本一致;当面荷载为120~160 kPa时,均值服从正态分布N2(0.765 7, 0.168 52),在置信度为95%下的置信区间为[0.637 2, 0.884 1],说明该组荷载下的计算值大于实际沉降,需适当折减;当面荷载为200~240kPa时,经验系数均值服从正态分布 N3(0.594 2, 0.116 42),在置信度为95%下的置信区间为[0.555 5, 0.723 1],说明随着荷载的增大,计算值更偏于保守,需折减计算值,使之更接近实际情况。
从表4结果还可发现:应用Bootstrap法时,仿真结果出现了较小偏差。这主要是样本量太少,使仿真过程逐渐偏离真值所致。通过引入纠偏量进行纠偏处理,可减少结果的偏差,使纠偏后的置信区间更符合母体分布特征。
表4 Bootstrap法经验系数分析结果
Table 4 Results of empirical coefficients of Bootstrap method
3 结果对比分析
为验证本文方法的正确性和有效性,将本文结果与文献[8]中的Bayes法统计分析结果进行对比分析。
根据Bayes原理,在荷载应力为40,80,120,160,200和240 kPa时,红黏土沉降计算经验系数ψs的后验分布均符合正态分布,且均集中在区间[0.588, 1.000][8]。可见:本文在置信度为95%下的置信区间与之基本一致,且本文方法所得区间更小,说明结果相对更精确。
两者的结果之所以存在差异,主要在于计算方法引起的差异:文献[8]采用Bayes方法对6个面荷载下的经验系数分别进行推导,故样本相对较少(n=3),在此基础上推导所得后验分布的可靠性依赖于样本的质量和假设的先验分布的准确程度;本文方法对荷载区间进行重新处理,可获得更多的样本(n=6),且模拟过程中不需要假设先验分布的分布概型,在抽样次数较多的情况下可获得相对稳定可靠的结果,故所得结果的精度有所提高。
4 结论
(1) 红黏土沉降计算经验系数ψs随荷载的增大而减少,在面荷载变化范围较小时,其均值的概率分布符合正态分布规律;当荷载在0~240 kPa范围内变化时,置信度为95%的经验系数均值置信区间在[0.556, 1.165]的某一区段内。
(2) Bootstrap法无需假设参数的分布概型,直接根据样本抽样,得到Bootstrap样本,从而统计出小样本下参数的概率分布和参数的置信区间,为沉降经验系数的工程取值提供了参考。
(3) 当样本量很少时,应用Bootstrap法可能导致置信区间出现偏差,通过纠偏处理可在一定程度上克服该缺点,获得更合理的参数置信区间。
参考文献:
[1] GB 50007—2002, 建筑地基基础设计规范[S].
GB 50007—2002, Code for design of building foundation[S].
[2] 张广文, 刘令瑶. 确定随机变量概率分布参数的推广Bayes法[J]. 岩土工程学报, 1995, 17(3): 91-94.
ZHANG Guang-wen, LIU Ling-yao. Extended Bayesian method for determining probabilistic distribution parameters of random variables[J]. Chinese Journal of Geotechnical Engineering, 1995, 17(3): 91-94.
[3] 徐超, 杨林德. 随机变量拟合优度检验和分布参数Bayes估计[J]. 同济大学学报, 1998, 26(3): 340-344.
XU Chao, YANG Lin-de. Test of goodness of fit of random variables and Bayesian estimation on distribution parameters[J]. Journal of Tongji University, 1998, 26(3): 340-344.
[4] 王俊杰, 陈爱玖, 姬凤玲, 等. 岩土参数的概率分布拟合及Bayes方法优化[J]. 华北水利水电学院学报, 2004, 25(2): 51-54.
WANG Jun-jie, CHEN Ai-jiu, JI Feng-lin, et al. Probability distribution fitting and Bayes method optimization on geotechnical parameter[J]. Journal of North China Institute of Water Conservancy and Hydroelectric Power, 2004, 25(2): 51-54.
[5] 张伟, 李夕兵, 宫凤强. 基于专家信息融合法的岩土参数概率分布推断[J]. 地下空间与工程学报, 2005, 1(6): 929-931.
ZHANG Wei, LI Xi-bing, GONG Feng-qiang. Probabilistic distribution of rock & soil parameters by using expert’s information fusion method[J]. Chinese Journal of Underspace and Engineering, 2005, 1(6): 929-931.
[6] 宫凤强, 李夕兵, 邓建. 基于AHP先验分布融合法的岩土参数概率分布推断[J]. 岩土工程学报, 2006, 28(10): 1313-1318.
GONG Feng-qiang, LI Xi-bing, DENG Jian. Probabilistic distribution of geotechnical parameters by using AHP prior distribution fusion method[J]. Chinese Journal of Geotechnical Engineering, 2006, 28(10): 1313-1318.
[7] 宫凤强, 李夕兵, 邓建. 基于多源信息融合法的岩土力学参数概率分布推断[J]. 岩土力学, 2007, 28(3): 599-604.
GONG Feng-qiang, LI Xi-bing, DENG Jian. Inferring probabilistic distribution of rock & soil mechanical parameters by using multiple sources information fusion method[J]. Rock and Mechanics, 2007, 28(3): 599-604.
[8] 王永和, 李珍玉, 胡萍, 等. 地基沉降修正系数的Bayes概率推断[J]. 岩土力学, 2009, 30(2): 324-327.
WANG Yong-he, LI Zhen-yu, HU Ping, et al. Bayesian statistics conduct on modified coefficients for foundation settlement calculation[J]. Rock and Soil Mechanics, 2009, 30(2): 324-327.
[9] Efron B. Bootstrap methods: Another look at the jackknife[J]. Ann Statist, 1979, 7(1): 1-26.
[10] Efron B. Nonparametric estimates of standard error and confidence intervals[J]. The Canadian Journal of Statistics, 1981, 9(2): 137-172.
[11] Harris R I D, Judge G. Small sample testing for cointegration using the bootstrap approach[J]. Economics Letters, 1998, 58: 31-37.
[12] Ramalho J J S. Bootstrap bias-adjusted GMM estimators[J]. Economics Letters, 2006, 92(1): 149-155.
[13] Mudelsee M, Alkio M. Quantifying effects in two-sample environmental experiments using bootstrap confidence intervals[J]. Environmental Modelling & Software, 2007, 22: 84-96.
[14] Mazucheli J, Barros E A C, Achcar J A. Bootstrap condence intervals for the mode of the hazard function[J]. Computer & Methods and Programs in Biomedicine, 2005, 79: 39-47.
(编辑 杨幼平)
收稿日期:2010-08-12;修回日期:2010-11-10
基金项目:国家自然科学基金资助项目(51078170);江苏大学基金资助项目(10DJG097);江苏大学博士后科研资助项目(1143001087)
通信作者:谢桂华(1976-),女,湖南双峰人,博士后,讲师,从事土木工程的教学与研究;电话:13862441310;E-mail: xgh2007@ujs.edu.cn