|||
空间插值包括两类:确定性插值和地统计插值,地统计插值就是指克里格(Kriging)插值,这篇博客就是来探讨克里格插值的一般过程。第一步,对输入数据的性质进行分析,查看其分布、特征等情况。
地统计理论基础包括前提假设、区域化变量、变异分析和空间估值。这里仅就前提假设做一些介绍,其他三个方面请参考:汤国安, 杨昕. ArcGIS地理信息系统空间分析实验教程[M]. 北京: 科学出版社, 2006。
地统计插值的前提假设
1. 随机过程
地统计学认为研究中的所有样本值都是随机过程的结果,即所有样本值都不是相互独立的,它们是遵循一定的内在规律的。因此地统计学就是要揭示这种内在规律,并进行预测。
2. 正态分布
地统计学与统计学相似,也假设大量样本是服从正态分布的。对数据进行分析,若不符合正态分布的假设,应对数据进行变换,转为符合正态分布的形式,再进行克里格插值。
3. 平稳性
对于大部分的空间数据而言,平稳性的假设是合理的。这其中包括两种平稳性:一是均值平稳,即假设均值是不变的并且与位置无关;另一类是与协方差函数有关的二阶平稳和与半变异函数有关的内蕴平稳。二阶平稳是假设具有相同的距离和方向的任意两点的协方差是相同的,协方差只与这两点的值相关而与它们的位置无关。内蕴平稳假设是指具有相同距离和方向的任意两点的方差(即变异函数)是相同的。二阶平稳和内蕴平稳都是为了获得基本重复规律而作的基本假设,通过协方差函数和变异函数可以进行预测和估计预测结果的不确定性。
数据探索性分析
数据探索性分析剖析空间数据的分布情况、全局的变化趋势、空间自相关等等方面的特征和性质。目的在于促进数据分析者深入理解数据和研究对象,从而为数据的插值制定较好的调整对策(剔除异常值、数据变换,等)。以下,以我的数据为例,描述数据探索性分析的一般过程。
数据描述:内蒙古与河北49个气象站点2011年7、8月的平均温度数值,在Geostatistical Analyst/Create Subsets...下分成两个数据子集(training和test),分别包含24和25个站点。数据training将作为以下过程的插值数据,数据test作为对插值结果的验证数据。三个数据集附在页面的最下部。
1. 直方图
直方图检验输入数据生态分布的偏离状态。主要观察两个参数:峰度(Kurtosis)和偏态(Skewness)。峰度描述数据分布高度,正态分布应为3;偏态描述数据左右的对称性,正态分布下应为0。通过变换(Transformation),检验峰度和偏态的数值,在何种情况下最趋近于3和0。如图 1所示,None情况下峰度与偏态最接近于最优,那么该数据training不做变换。
图 1
2. Voronoi图
Voronoi图有助于理解每个采样点控制的区域的范围,也可以体现每个采样点对区域内插的重要性。利用Voronoi图可以找出一些对区域内插作用不大且可能影响内插精度的采样点,将其剔除。聚类和熵方法生产的Voronoi图可用来帮助识别可能的离群值。在自然界中,距离相近的事物比距离远的事物具有更大的的相似性。熵值是量度相邻单元相异性的一个指标。因此,局部离群值可以通过高熵值识别出来。如图 2所示,右边圆圈显示的熵值比较大,高于周围的熵值,可能就是局部离群值。
同样,一般认为某个特定单元的值至少与它周围单元中的某一个值相近,因此聚类方法也能够将那些与它们周围单元不相同的单元识别出来。如图 3所示,下方圆圈与上方聚类的差别较大,但与其坐下的两个点差别也还不大。
综合图 2和图3,这个点不能判断其为局部离群值。
图2
图 3
3. 正态QQ图
正态QQ图也是一种度量正态分布情况的方法。如果数据越接近一条直线,则其越接近服从正态分布。如果有个别采样点偏离直线太多,那么这些采样点可能是一些异常点,可考虑采用其他ESDA工具进行检验。此外,如果在正态QQ图中数据没有显示出正态分布,则有必要应用某种克里格插值法之前将数据进行某种变换,使其服从正态分布。如图 4所示,经对数(Log)变换后,数据的偏离程度反而比之前变大了,所以该数据不做任何的变换。
图 4
4. 普通QQ图
普通QQ图用来评估两个数据集分布的相似性,解释了两个物体(变量)之间的相关关系。如果QQ图上曲线呈直线,说明两物体呈一种线性关系,可以用一个一元一次方程式来拟合;若呈抛物线,说明两物体的关系可以用一个二元多项式来拟合。如图 5所示,两个变量之间呈一种线性相关关系(红线为本人添加),可以用一元一次方程式拟合。
图 5
5. 趋势分析工具
趋势分析工具提供用户研究区采样点转换为以感兴趣的属性值为高度的三维透视图。允许用户从不同视角分析采样数据集的全局趋势。趋势分析图中的每一根竖棒代表了一个数据点的值(高度)和位置。这些点被投影到一个东西向和一个南北向的正交平面上。通过投影点可以作出一条最佳拟合线,并用它来模拟特定方向上存在的趋势。如果该线是平直的,则表明没有趋势存在。如图 6所示,x轴方向的趋势线(绿线)由东向西逐渐上升,y轴趋势线(蓝线)由北至南逐渐升高。这比较符合我国大陆夏季的气温特点,可见趋势分析工具是一个很好的观察变量空间分布特点的工具,具有直观、简洁的优势。
图 6
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 20:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社