 (中国科学院 遥感与数字地球研究所,北京,100101)

Ground sampling strategy for surface soil moisture in heterogeneous remote sensing pixels

WANG Chunmei, ZHAN Yulin, WEI Xiangqin, LI Juan, LI Lingling, LIU Miao

 (The Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100101, China)

Abstract: The most important question is how to select reasonable ground sampling method to obtain the mean soil moisture within the mixed pixels. Some traditional sampling methods, including traditional statistical sampling, self-sampling, random sampling, geostatistical sampling, stratified sampling and temporal stability, all need to be more intensive ground measured data in order to obtain a reasonable sampling plan. However, in practice, it is very difficult to make the ground pre sampling in the regional scale, so the traditional sampling methods can hardly meet the requirement of the soil moisture monitoring. In recent years, the priori knowledge ground-based sampling method has become a widely used sampling method without the more intensive measured data. The priori knowledge ground soil sampling will be important in future research and development direction. The characteristics, advantages and the applicable conditions of different ground sampling methods were analyzed, which will provide the basis for the construction of the algorithm model and the validation of the soil moisture products.

Key words: soil moisture; heterogeneous; sampling

土壤含水量是水文模型、气候预测模型以及干旱监测模型中重要的参数之一[1-5]。遥感是获取生产区域与全球土壤含水量的主要手段,近年来,基于AMSR-E和SMOS等被动微波卫星遥感数据,生产了全球土壤含水量产品[1, 6],另外,2015年计划发射的土壤水分主、被动微波卫星(SMAP)也将为土壤含水量产品的生产提供新的数据源[7-10]。无论是土壤含水量反演算法模型的构建还是产品的真实性检验,都需要通过地面仪器获得实测土壤含水量[11-15]。但目前土壤含水量的地面采样研究工作严重滞后,特别是对非均匀地表特性的尺度转换研究滞后,这使得区域尺度的遥感信息与田间尺度的地表观测信息脱节,进而制约着土壤含水量定量遥感产品在相关领域更好地推广与应用。土壤含水量具有较大的时空变异,尤其是表层土壤含水量变化剧烈[16-17],这就要求在土壤含水量定量遥感产品模型构建和地面检验时,必须对地面实测数据实时同步进行,这导致对土壤含水量的地面采样存在困难。因此,在一定的精度条件下,如何通过合理的地面采样方法获取非均质混合像元的地面真值,是遥感准确反演土壤含水量需要解决的基本问题,这对于定量遥感产品的模型构建和地面真实性检验均具有十分重要的意义。迄今为止,众多学者探讨了土壤含水量地面采样的策略问题。一个准确的样本设计方案应保证样本点的均值是对像元总量均值进行很好估计[18-19]。合理取样数目取决于土壤含水量样本总量的变异性、估计像元总量均值所要求的精度、估计像元总量均值所需的置信区间、地面采样的费用等。在过去的几十年里,已建立多种土壤含水量地面采样方法,本文将其归纳为统计特征采样、时空格局采样和先验知识采样,重点对土壤含水量地面采样方法的国内最新研究进展进行分析,总结常用地面采样方法的特点和优势,并探讨不同采样方法的适用条件。

1  基于土壤含水量样本数据统计特征的地面采样

1.1  传统统计采样

在地学研究中,目前应用最多的是传统统计方  法 [20-24],同时,也是遥感反演常用的地面采样方法,即根据像元内的变异程度,估计像元内的合理取样数目。当像元内土壤含水量样本数据相互独立且满足正态分布时,可用下面公式估计一定误差水平下所需的地面合理取样数目(n0)[14]




1.2  自助方法采样


若某像元内有n个表层土壤含水量的地面观测值θi (i=1,2,…,n),当n足够大时,像元的平均含水量可以认为是这n个实测含水量的平均值。自助法不受样本统计分布的局限,可通过对n个观察值的重复抽样模拟得到接近真实的样本分布特征[27]。应用自助法确定采样策略的基本思路如下:

1) 从像元内所有实测数据n中分别随机选出m个数据(m=1,2,3,…,n),每次选择随机重复B次。

2) 计算每次选择得到的m个样本均值,共获得B个样本均值。

3) 分别计算B个均值与全部n个实测样点均值之间的相对误差,分析相对误差在5%或10%内的置信水平LC

4) 绘制置信水平LC与样本数目m的关系图,从而确定一定LC(95%或90%)下对应的合理取样数目。

MANLY[28]建议自助采样实际应用中的B应不少于1 000次,有时甚至需要设置10 000次。然而,为了避免冗长的计算时间,很多研究者在实际应用中尽量选择小的样本数目(n)或者少的重复数(B)[29-30]。但即使样本数目n很小,1 000次甚至10 000次的重复数B也很难覆盖所有的组合数,如当n=20和m=10时,从n个数据中随机选择m个数据共存在的组合数有=184 756个,此时设置较小的B(<184 756)势必会导致样本数目置信水平不稳定[29]。更重要的是,自助法的采样效率并不高于传统统计采样效率,这也是限制自助法在遥感地面采样应用的关键原因[16],而且这种方法也没有考虑样点的空间布局。

1.3  随机组合采样

为了发挥自助方法优势,针对自助方法存在的精度不稳定和采样效率低等问题,提出利用随机组合地面采样估算像元内的土壤含水量地面合理取样数   目[31]。这种方法的改进之处在于将所有的组合数目s(s=)代替固定重复次数B,以s个平均值代替B个平均值,其余步骤则与自助法的相同。

随机组合方法不需要传统统计和分层采样所要求的数据独立和正态分布前提,也不需要地统计学采样方法的半方差函数信息,因此,随机组合方法的实际应用范围更广,而且与传统统计、地统计、分层采样和自助采样相比,随机组合方法提供了合理有效的采样策略。在相同的精度要求下,随机组合方法估算的合理取样数目要远比传统统计和自助采样的数目   少[21]。然而,随着像元分辨率的降低,土地利用类型多样,地形地势复杂,土壤含水量势必具有更高的时间变异和空间变异,这意味着随机组合方法需要有地面更密集的实测土壤含水量数据才能获得合理的采样方案。但随着实测样点的增加,尤其当变异系数较大或观测数据较复杂时,随机组合计算结果往往会消耗较长的时间,而且这种方法也没有考虑样点的空间布局。

2  基于土壤含水量样本数据时空变异的地面采样

2.1  地统计采样









2.2  区域分层采样


在像元土壤含水量分层采样中,将像元大小为M的总体分成L个不相重叠的层,它们的大小分别为M1,M2,…,ML。第q(q=1,2,…,L)层的权重为Wq=Mq / M,可认为是第q层面积占整个像元面积的比例[29]。分层采样的总体估计均值是L个样本均值的加权平均,的方差分别为:



式中:σq,nq和fq=nq / Mq 分别为第q层的标准差、样本数目和抽样比。若数据满足正态分布,在1-α的置信水平下,可代替式(5)中的,则所有层的合理取样数目可表示为




虽然分层采样精度较高,能有效地减少取样时间和降低取样成本,但也受到一些条件的限制。例如,一方面精度受分层方式的影响,另一方面必须有进行像元分层的先验资料支持,若按土壤类型对非均质中低分辨率像元进行分区,则首先必备土壤质地分类  图[23];若按土地利用类型进行分区,则必须有试验区域详细的土地利用分类图[40]。总之,在分层取样之前,需要试验区域的部分先验数据和资料对其进行分层,这在实际调查中工作量较大。

2.3  时间稳定性采样


不同位置间的变异性可利用地统计理论进行分析,而不同样点位置随时间的变化则可用时间稳定性来表征[33]。在分析试验区的稳定样点之前,首先利用斯皮尔曼等级(Spearman rank)相关系数rs验证稳定位置的存在性:


式中:m为土壤含水量对应的观测数目;(或)为位置i处的土壤含水量观测值在t(或t′)时刻的等级。rs 越接近1,则观测值在时期t和t′的稳定性越大。










时间稳定采样是基于前期大量土壤含水量实测值,筛选代表性测点非常繁琐。一般来说,在测量周期内需测定 13~15次,才能获得较准确的结果。

3  基于土壤含水量主控因子先验知识的地面采样

在遥感验证观测试验中,通常对实验区的背景知识(植被分布、地形高程、土壤质地等)有一定认识。随着大型验证观测项目的开展,逐渐发展了基于先验知识的采样方法,这种方法是基于由相关先验知识获取的多元辅助变量进行的优化分区进行的样点布设。根据各样区内部空间异质性和样区间的相关性进行统计分析,构建优化的主控因子先验知识样本布设方案。土壤含水量是众多环境因素共同作用的结果,包括地形、植被类型、土壤类型、降雨量等,土壤含水量的地面采样需要考虑主要影响因子。目前已有文献报道关于土壤含水量稳定性测点与影响因素的关系分析,如:WANG等[43]在山东省非耕地面积的抽样调查中,证实了在空间相关性较强的地区,有先验知识的采样方式具有更高的采样效率;曹志冬等[44]比较了地理空间对象中不同先验知识抽样方式的分层效率,指出有效的采样方法会降低样本点的不确定性;高磊[45]利用土壤属性和海拔因子预测土壤含水量稳定性采样测点。贾玉华等[46]引入植被类型/土层深度、土壤质地分析土壤含水量的稳定性。曾也鲁等[12]提出了基于 NDVI 植被指数先验知识的LAI采样方法,并指出这种方法对非均质特性较明显的区域具有较高的精度和较强的稳定性。基于先验知识指导的采样法已经成为目前采样效率较高且应用广泛的采样方法,尤其是采样区的空间相关性越强,先验知识越丰富,知识分层的地面采样效果越显著[44]。但是,这类研究工作大多是基于单一环境因子或多环境因子对代表性测点的简单相关或回归统计,多限于变化趋势性的表面观测,有关土壤含水量稳定性测点与土壤质地、植被类型及地形因子等不同影响因素的综合研究较少,尤其缺少对土壤含水量稳定性测点的定量研究。

4  结论

1) 将非均质中低分辨率像元的土壤含水量地面采样方法分为3类:基于样本数据统计特征的地面采样、基于样本数据时空格局的地面采样和基于主控因子先验知识的地面采样。

2) 基于样本数据统计特征的地面采样和基于时空格局的地面采样几乎都需要地面较密集的实测土壤含水量或者掌握土壤含水量较准确的变异程度,才能获得合理的地面采样方案。

3) 基于先验知识的地面采样方法不需要地面较密集的实测土壤含水量,将成为一个重要的研究内容和发展方向。由于土壤含水量的影响因素极其复杂,必须深入研究土壤含水量稳定性测点与土壤质地、植被类型及地形因子等不同影响因素的定量关系,才能建立先验知识的合理、高精度地面采样。

4) 被动微波作为目前比较成熟的遥感手段将越来越普及。未来土壤含水量遥感产品的地面采样方法应该更多地解决无地面实测数据区域的地面采样问题,使采样方法更加具有实用性,使其更好地服务于土壤含水量反演算法的精度验证和产品的真实性检验。


基金项目(Foundation item):国家自然科学基金资助项目(41371416)(Project (41371416) supported by the National Natural Science Foundation of China)



