第八章 空间分析 空间分析是对分析空间数据有关技术的统称。 根据作用的数据性质不同,可以分为: (1)基于空间图形数据的分析运算; (2)基于非空间属性的数据运算; (3)空间和非空间数据的联合运算。
1.空间查询与量算 1.1空间查询 图形与属性互查是最常用的查询,主要有两类:第一类是按属性信息的要求来查询定位空间位置,称为“属性查图形”; 第二类是根据对象的空间位置查询有关属性信息,称为“图形查属性”。
在大多数GIS中,提供的空间查询方式有: 1)基于空间关系查询 空间实体间存在着多种空间关系,包括拓扑、顺序、距离、方位等关系。通过空间关系查询和定位空间实体是地理信息系统不同于一般数据库系统的功能之一。 2)基于空间关系和属性特征查询 3)地址匹配查询
1.2空间量算 1.2.1几何量算 几何量算对不同的点、线、面地物有不同的含义: 点状地物(0维):坐标; 线状地物(1维):长度,曲率,方向; 面状地物(2维):面积,周长,形状,曲率等; 体状地物(3维):体积,表面积等。
1.2.2形状量算 面状地物形状量测的两个基本考虑:空间一致性问题,即有孔多边形和破碎多边形的处理;多边形边界特征描述问题。 度量空间一致性最常用的指标是欧拉函数,用来计算多边形的破碎程度和孔的数目。欧拉函数的结果是一个数,称为欧拉数。欧拉函数的计算公式为: 欧拉数=(孔数)-(碎片数-1)
关于多边形边界描述的问题,由于面状地物的外观是复杂多变的,很难找到一个准确的指标进行描述。最常用的指标包括多边形长、短轴之比,周长面积比,面积长度比等。其中绝大多数指标是基于面积和周长的。通常认为圆形地物既非紧凑型也非膨胀型,则可定义其形状系数r为: 其中P为地物周长,A为面积。如果r<1为紧凑型;r=1为标准圆;r>1为膨胀型。
1.2.3质心量算 质心是描述地理对象空间分布的一个重要指标。 质心量测经常用于宏观经济分析和市场区位选择,还可以跟踪某些地理分布的变化,如人口变迁,土地类型变化等。
1.2.4距离量算 “距离”是人们日常生活中经常涉及到的概念,它描述了两个事物或实体之间的远近程度。 最常用的距离概念是欧氏距离,无论是矢量结构,还是栅格结构都很容易实现。 在GIS中,距离通常是两个地点之间的计算,但有时人们想知道一个地点到所有其它地点的距离,这时得到的距离是一个距离表面。如果一区域中所有的性质与方向无关,则称为各向同性区域。
2.空间变换 空间变换:地理信息系统通常是按有一定意义的图层和相应的属性建立空间数据库的。为了满足特定空间分析的需要,需对原始图层及其属性进行一系列的逻辑或代数运算,以产生新的具有特殊意义的地理图层及其属性,这个过程称为空间变换。
地理信息系统中空间数据可分为矢量和栅格两种数据结构。由于矢量结构中包含了大量的拓扑信息,数据组织复杂,使得空间变换十分繁琐。而栅格结构简单规则,空间变换比较容易。另外基于矢量结构的空间变换,对于单个图层意义不大,生成新图层时往往需要多个图层的信息,在多图层叠加分析中意义很大。 基于栅格结构的空间变换可分为三种方式: (1)单点变换; (2)邻域变换; (3)区域变换。
3.再分类 再分类:通过分类找出隐藏信息是地理信息系统的重要功能之一。与传统地图相比,地图上所载负的数据是经过专门分类和处理过的,而地理信息系统存储的数据则具有原始数据的性质,所以可以根据不同的需要对数据再进行分类和提取。由于这种分类是对原始数据进行的再次分类组织,因此称为再分类(Reclassification)。
4.缓冲区分析 缓冲区:所谓缓冲区就是地理空间目标的一种影响范围或服务范围。 缓冲区分析:从数学的角度看,缓冲区分析的基本思想是给定一个空间对象或集合,确定它们的邻域,邻域的大小由邻域半径R决定。 空间缓冲区分析是指根据分析对象的点、线、面实体,自动建立它们周围一定距离的带状区,用以识别这些实体或主体对邻近对象的辐射范围或影响度,以便为某项分析或决策提供依据;
下图为点对象、线对象、面对象及对象集合的缓冲区示例
另外还有一些特殊形态的缓冲区,如点对象有三角形,矩形和圈形等,对于线对象有双侧对称,双侧不对称或单侧缓冲区,对于面对象有内侧和外侧缓冲区。这些适合不同应用要求的缓冲区,尽管形态特殊,但基本原理是一致的
缓冲区计算的基本问题是双线问题 1)角分线法 双线问题最简单的方法是角分线法(简单平行线法)。 算法是:在轴线首尾点处,作轴线的垂线并按缓冲区半径R截出左右边线的起止点;在轴线的其它转折点上,用与该线所关联的前后两邻边距轴线的距离为R的两平行线的交点来生成缓冲区对应顶点。如图所示
角分线法的缺点是难以最大限度保证双线的等宽性,尤其是在凸侧角点在进一步变锐时,将远离轴线顶点。根据上图,远离情况可由下式表示: 当缓冲区半径不变时,d随张角B的减小而增大,结果在尖角处双线之间的宽度遭到破坏
2)凸角圆弧法 在轴线首尾点处,作轴线的垂线并按双线和缓冲区半径截出左右边线起止点;在轴线其它转折点处,首先判断该点的凸凹性,在凸侧用圆弧弥合,在凹侧则用前后两邻边平行线的交点生成对应顶点。这样外角以圆弧连接,内角直接连接,线段端点以半圆封闭。如图所示
空间缓冲区的三大要素,即主体、邻近对象和作用条件。 空间缓冲区分析的模型 线性模型; 二次模型; 指数模型。
方案一 方案二 空间缓冲区分析的方法 计算模型参数f0和d0 计算模型参数f0和d0 设定di 设定Fi 计算ri和Fi 计算di 方案一 方案二 计算模型参数f0和d0 计算模型参数f0和d0 设定di 设定Fi 计算ri和Fi 计算di 缓冲区图形表达 缓冲区图形表达
5.叠加分析 空间叠合分析的概念 叠加分析是地理信息系统最常用的提取空间隐含信息的手段之一。该方法源于传统的透明材料叠加,即将来自不同的数据源的图纸绘于透明纸上,在透光桌上将其叠放在一起,然后用笔勾出感兴趣的部分—提取出感兴趣的信息。 地理信息系统的叠加分析是将有关主题层组成的数据层面,进行叠加产生一个新数据层面的操作,其结果综合了原来两层或多层要素所具有的属性。 叠加分析不仅包含空间关系的比较,还包含属性关系的比较。
空间叠合分析是指在统一空间参照系统条件下,每次将同一地区两个地理对象的图层进行叠合,以产生空间区域的多重属性特征,或建立地理对象之间的空间对应关系; 地理信息系统叠加分析可以分为以下几类:视觉信息叠加、点与多边形叠加、线与多边形叠加、多边形叠加、矢量层叠加、栅格图层叠加。
一、视觉信息叠加 视觉信息叠加是将不同侧面的信息内容叠加显示在结果图件或屏幕上,以便研究者判断其相互空间关系,获得更为丰富的空间信息。 地理信息系统中视觉信息叠加包括以下几类: (1)点状图,线状图和面状图之间的叠加显示。 (2)面状图区域边界之间或一个面状图与其他专题区域边界之间的叠加 (3)遥感影象与专题地图的叠加 (4)专题地图与数字高程模型(DEM)叠加显示立体专题图 视觉信息叠加不产生新的数据层面,只是将多层信息复合显示,便于分析。
二 、点与多边形叠加 点与多边形叠加,实际上是计算多边形对点的包含关系。矢量结构的GIS能够通过计算每个点相对于多边形线段的位置,进行点是否在一个多边形中的空间关系判断。 在完成点与多边形的几何关系计算后,还要进行属性信息处理。最简单的方式是将多边形属性信息叠加到其中的点上。当然也可以将点的属性叠加到多边形上,用于标识该多边形,如果有多个点分布在一个多边形内的情形时,则要采用一些特殊规则,如将点的数目或各点属性的总和等信息叠加到多边形上
三、线与多边形叠加 线与多边形的叠加,是比较线上坐标与多边形坐标的关系,判断线是否落在多边形内。计算过程通常是计算线与多边形的交点,只要相交,就产生一个结点,将原线打断成一条条弧段,并将原线和多边形的属性信息一起赋给新弧段
四、多边形与多边形的叠合分析 多边形与多边形的叠合分析是指将两个不同图层的多边形要素相叠合,产生输出层的新多边形要素,用以解决地理变量的多准则分析、区域多重图幅要素更新、相邻图幅拼接和区域信息提取等; 多边形叠加是GIS最常用的功能之一。多边形叠加将两个或多个多边形图层进行叠加产生一个新多边形图层的操作,其结果将原来多边形要素分割成新要素,新要素综合了原来两层或多层的属性
叠加过程可分为几何求交过程和属性分配过程两步: 几何求交过程首先求出所有多边形边界线的交点,再根据这些交点重新进行多边形拓扑运算,对新生成的拓扑多边形图层的每个对象赋一多边形唯一标识码,同时生成一个与新多边形对象一一对应的属性表 由于矢量结构的有限精度原因,几何对象不可能完全匹配,叠加结果可能会出现一些碎屑多边形(Silver Polygon),如图所示。通常可以设定一模糊容限以消除它。
多边形叠加结果通常把一个多边形分割成多个多边形,属性分配过程最典型的方法是(将输入图层对象的属性拷贝到新对象的属性表中,或把输入图层对象的标识作为外键,直接关联到输入图层的属性表)。 这种属性分配方法的理论假设是多边形对象内属性是均质的,将它们分割后,属性不变。也可以结合多种统计方法为新多边形赋属性值。 根据叠加结果最后欲保留空间特征的不同要求,一般的GIS软件都提供了三种类型的多边形叠加操作,如下图所示
多边形与多边形叠合分析的功能: union; intersect; identity; erase; update; clip。
五、基于矢量数据的叠合分析 参与分析的两个图层的要素均为矢量要素 六、基于栅格数据的叠合分析 参与分析的两个图层的要素均为栅格要素
6.网络分析 对地理网络(如交通网络)、城市基础设施网络(如各种网线、电力线、电话线、供排水管线等)进行地理分析和模型化,是地理信息系统中网络分析功能的主要目的。 网络分析是运筹学模型中的一个基本模型,它的根本目的是研究、筹划一项网络工程如何安排,并使其运行效果最好,如一定资源的最佳分配,从一地到另一地的运输费用最低等。其基本思想则在于人类活动总是趋于按一定目标选择达到最佳效果的空间位置。
6.1网络数据结构 网络数据结构的基本组成部分和属性如下: 1)链(Link) 网络中流动的管线,如街道、河流、水管等,其状态属性包括阻力和需求。 2)结点(Node) 网络中链的结点,如港口、车站、电站等,其状态属性包括阻力和需求等。结点中又有下面几种特殊的类型 :障碍(Barrier)拐点(Turn)中心(Center)站点(Stop)
网络图论的基本概念 空间网络的类型和构成 图及其构成元素; 有向图和无向图; 邻接矩阵和关联矩阵。 空间网络的拓扑分类; 空间网络的构成元素。
空间网络分析方法 路径分析 1)静态求最佳路径: 在给定每条链上的属性后,求最佳路径。 1)静态求最佳路径: 在给定每条链上的属性后,求最佳路径。 2)N条最佳路径分析: 确定起点或终点,求代价最小的N条路径,因为在实践中最佳路径的选择只是理想情况,由于种种因素而要选择近似最优路径。 3)最短路径或最低耗费路径: 确定起点、终点和要经过的中间点、中间连线,求最短路径或最小耗费路径。 4)动态最佳路径分析: 实际网络中权值是随权值关系式变化的,可能还会临时出现一些障碍点,需要动态的计算最佳路径。
计算最短路径的Dijkstra算法 无论是计算最短路径还是最佳路径,其算法都是一致的,不同之处在于有向图中每条弧的权值设置。如果要计算最短路径,则权重设置为两个节点的实际距离;而要计算最佳路径,则可以将权值设置为从起点到终点的时间或费用。 1)用带权的邻接矩阵Cost来表示带权的n个节点的有向图,Cost[i,j]表示弧<vi,vj>的权值,如果从vi到vj不连通,则Cost[i,j]=∞。下图表示了一个带权有向图以及其邻接矩阵。 然后,引进一个辅助向量Dist,每个分量Dist[i]表示从起始点到每个终点vi的最短路径长度。假定起始点在有向图中的序号为i0,并设定该向量的初始值为: Dist[i]=Cost[i0,i] vi∈V。 令S为已经找到的从起点出发的最短路径的终点的集合。
2)选择Vj,使得 Dist[j]=Min{ Dist[i]|Vi∈V-S} vi∈V vj就是当前求得的一条从vi0出发的最短路径的终点,令 S=S∪{vj} 3)修改从vi0出发到集合V-S中任意一顶点vk的最短路径长度。如果 Dist[j]+Cost[j,k]<Dist[k] 则修改Dist[k]为: Dist[k]=Dist[j]+Cost[j,k]
4)重复第2、3步操作共n-1次,由此求得从vi0出发的到图上各个顶点的最短路径是依路径长度递增的序列。下表是上图根据Dijkstra计算的结果。 终点 从v0到其它各个节点的最短路径 v1 ∞ ∞ 无 v2 10 (v0,v2) v3 60 (v0,v2,v3) 50 (v0,v4,v3) v4 30 (v0,v4) (v0,v4) v5 100 (v0,v5) 90 (v0,v4,v5) 60(v0,v4,v3, v5) vj
7.空间插值 7.1空间插值的概念和理论 空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其它空间现象的分布模式进行比较,它包括了空间内插和外推两种算法。 空间内插算法是一种通过已知点的数据推求同一区域其它未知点数据的计算方法;空间外推算法则是通过已知区域的数据,推求其它区域数据的方法。
在以下几种情况下必须作空间插值: 1)现有的离散曲面的分辨率,象元大小或方向与所要求的不符,需要重新插值。例如将一个扫描影象(航空像片、遥感影象)从一种分辨率或方向转换到另一种分辨率或方向的影象。 2)现有的连续曲面的数据模型与所需的数据模型不符,需要重新插值。如将一个连续的曲面从一种空间切分方式变为另一种空间切分方式,从TIN到栅格、栅格到TIN或矢量多边形到栅格。 3)现有的数据不能完全覆盖所要求的区域范围,需要插值。如将离散的采样点数据内插为连续的数据表面。
7.2空间插值的数据源 连续表面空间插值的数据源包括: 摄影测量得到的正射航片或卫星影象; 卫星或航天飞机的扫描影象; 野外测量采样数据,采样点随机分布或有规律的线性分布(沿剖面线或沿等高线); 数字化的多边形图、等值线图。
7.3空间插值方法 空间插值方法可以分为整体插值和局部插值方法两类。整体插值方法用研究区所有采样点的数据进行全区特征拟合;局部插值方法是仅仅用邻近的数据点来估计未知点的值。
7.3.1整体插值方法 1)边界内插方法 边界内插方法假设任何重要的变化发生在边界上,边界内的变化是均匀的,同质的,即在各方向都是相同的。这种概念模型经常用于土壤和景观制图,可以通过定义“均质的”土壤单元、景观图斑,来表达其它的土壤、景观特征属性。
2)趋势面分析 某种地理属性在空间的连续变化,可以用一个平滑的数学平面加以描述。思路是先用已知采样点数据拟合出一个平滑的数学平面方程,再根据该方程计算无测量值的点上的数据。 这种只根据采样点的属性数据与地理坐标的关系,进行多元回归分析得到平滑数学平面方程的方法,称为趋势面分析。它的理论假设是地理坐标(x,y)是独立变量,属性值Z也是独立变量且是正态分布的,同样回归误差也是与位置无关的独立变量。
3)变换函数插值 根据一个或多个空间参量的经验方程进行整体空间插值,也是经常使用的空间插值方法,这种经验方程称为变换函数。 整体插值方法通常使用方差分析和回归方程等标准的统计方法,计算比较简单。其它的许多方法也可用于整体空间插值,如傅立叶级数和小波变换,特别是遥感影象分析方面 ,但它们需要的数据量大。
7.3.2局部插值方法 局部插值方法只使用邻近的数据点来估计未知点的值,包括几个步骤: 1)定义一个邻域或搜索范围; 2)搜索落在此邻域范围的数据点; 3)选择表达这有限个点的空间变化的数学函数; 4)为落在规则格网单元上的数据点赋值。重复这个步骤直到格网上的所有点赋值完毕。
1)最近邻点法:泰森多边形方法 泰森多边形(Thiessen,又叫Dirichlet 或Voronoi多边形)采用了一种极端的边界内插方法,只用最近的单个点进行区域插值。 泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其它数据点的距离,并用其内数据点进行赋值。连接所有数据点的连线形成Delaunay三角形,与不规则三角网TIN具有相同的拓扑结构。
2)移动平均插值方法:距离倒数插值 距离倒数插值方法综合了泰森多边形的邻近点方法和趋势面分析的渐变方法的长处,它假设未知点x0处属性值是在局部邻域内中所有数据点的距离加权平均值。距离倒数插值方法是加权移动平均方法的一种。
3)样条函数插值方法 在计算机用于曲线与数据点拟合以前,绘图员是使用一种灵活的曲线规逐段的拟合出平滑的曲线。这种灵活的曲线规绘出的分段曲线称为样条。与样条匹配的那些数据点称为桩点,绘制曲线时桩点控制曲线的位置。曲线规绘出的曲线在数学上用分段的三次多项式函数来描述这种曲线,其连接处有连续的一阶和二阶连续导数。 样条函数是数学上与灵活曲线规对等的一个数学等式,是一个分段函数,进行一次拟合只有与少数点拟合,同时保证曲线段连接处连续。
4)空间自协方差最佳插值方法:克里金插值 克里金插值方法的区域性变量理论假设任何变量的空间变化都可以表示为下述三个主要成分的和: 1)与恒定均值或趋势有关的结构性成分; 2)与空间变化有关的随机变量,即区域性变量; 3)与空间无关的随机噪声项或剩余误差项。
8.空间统计分类分析 空间数据的集合分析 空间数据的查询 空间集合分析的概念; 空间集合分析的方法。 基于关系查询语言扩充的空间查询方法; 可视化空间查询方法; 基于自然语言的查询方法; 超文本查询方法。
多变量统计分析主要用于数据分类和综合评价 综合评价模型是区划和规划的基础 综合评价一般经过四个过程: 1)评价因子的选择与简化; 2)多因子重要性指标(权重)的确定; 3)因子内各类别对评价目标的隶属度确定; 4)选用某种方法进行多因子综合。
分类评价中常用的几种数学方法 : 1主成分分析(Principal Component Analysis,PCA) 主成分分析是通过数理统计分析,求得各要素间线性关系的实质上有意义的表达式,将众多要素的信息压缩表达为若干具有代表性的合成变量,这就克服了变量选择时的冗余和相关,然后选择信息最丰富的少数因子进行各种聚类分析,构造应用模型
设有n个样本,户个变量。将原始数据转换成一组新的特征值——主成分,主成分是原变量的线性组合且具有正交特征。即将x1,x2,…,xp综合成m(m<p)个指标z1,z2,…,zm,即: z1=l11*x1+l12*x2+…+l1p*xp z2=l21*x1+l22*x2+…+l2p*xp … … zm=lm1*x1+lm2*x2+…+lmp*xp 这样决定的综合指标z1,z2,…,zm分别称做原指标的第一,第二,…,第m主成分。其中z1在总方差中占的比例最大,其余主成分z2,z3,…,zm的方差依次递减。
2层次分析法 (Analytic Hierarchy Process,AHP) 3系统聚类分析 系统聚类是根据多种地学要素对地理实体进行划分类别的方法,对不同的要素划分类别往往反映不同目标的等级序列 系统聚类的步骤一般是根据实体间的相似程度,逐步合并若干类别,其相似程度由距离或者相似系数定义。进行类别合并的准则是使得类间差异最大,而类内差异最小。
4判别分析 判别分析是预先根据理论与实践确定等级序列的因子标准,再将待分析的地理实体安排到序列的合理位置上的方法, 判别分析依其判别类型的多少与方法的不同,可分为两类判别、多类判别和逐步判别等。