第八章 空间分析
课 题 第八章 空间分析 目的要求 通过本章的学习,了解GIS中基本空间分析的功能及其实现算法。理解叠置分析的概念和类型,掌握多边形叠置分析的步骤和方法。理解缓冲区的概念和作用,并能说明其应用方法,理解生成线缓冲区的算法。 教学重点 空间查询与量算、缓冲区分析、叠置分析、网络分析、空间插值、分类统计 教学难点 网络分析、空间插值、分类统计 教学课时 8课时 教学方法 课堂实例+讲授
空间分析的目的 空间分析:指用于分析空间目标的一系列技术处理, 其目的是: (1)描述与认知空间数据分布特征,如点线面的空间分异状况; (2)解释空间现象与空间模式的形成机理,如城市土地利用变化研究; (3)调控在地理空间上发生的事件,如水资源的合理配置; (4)预测预报,如洪水的预测预报。
空间分析的主要方法 (1)基于地图的空间图形分析,如GIS中的缓冲区、叠加分析、数字高程模型,数字地面模型等; (2) 空间动力学分析,有城市扩张模型(驱动力等)、空间价格竞争模型(区位优势)、空间择位模型(中心地等); (3)空间信息分析,是指根据数据或统计方法建立的模型,如空间聚类、空间自相关、回归模型等。实际上,同一种空间分析方法和模型可以归属于不同的类型。例如,中心地属于空间信息分析模型,但中心地的形成又追求服务距离最短的动力学机制,可归属于空间动力学模型。
1.空间信息查询与量算 查询和定位空间对象,并对空间对象进行量算是GIS的基本功能之一,它是GIS进行高层次分析的基础。在GIS中,为进行高层次分析,往往需要查询定位空间对象,并用一些简单的量测值对地理分布或现象进行描述,如长度、面积、距离等。实际上,空间分析首先始于空间查询和量算,它是空间分析的定量基础。
(1)空间信息查询 图形和属性的互查是最常用的查询,主要有两类: 1、按属性信息的要求来查询定位空间位置,称为“属性查图形”。如在中国行政区划图上查询人口大于4000万且城市人口大于1000万的省有哪些?称为SQL查询. 2、根据对象的空间位置查询有关的属性信息,称为“图形查属性”。如一般的GIS软件都提供一个“INFO”工具,让用户利用鼠标,用点选、画线、矩形、圆、不规则多边形等工具选中地物,并显示所查询对象的属性列表,可进行有关统计分析。
(1)空间信息查询 1、基于空间关系查询 空间实体间存在多种空间关系,包括拓扑、距离、方位等。如查找满足下列条件的城市: 在京沪线的东部;距离京沪线不超过50公里; 城市人口大于100万; 城市区域面积5000平方公里.
(1)空间信息查询 面面查询:如与某个多边形相邻的多边形有哪些; 面线查询:如某个多边形内包含哪些线; 简单的点线面相互关系拓扑查询包括: 面面查询:如与某个多边形相邻的多边形有哪些; 面线查询:如某个多边形内包含哪些线; 面点查询:如某个多边形内有哪些点状地物; 线面查询:如某条线经过的多边形有哪些; 线线查询:如与某条河流相连的支流有哪些; 线点查询:如某条道路上有哪些桥梁,某条输电线上有哪些变电站点面查询:如某个点落在那个多边形内; 点线查询:如某个结点由哪些线相交而成;
(1)空间信息查询 传统的SQL并不能处理空间查询,对GIS而言,需要对SQL进行扩展,主要包括空间数据与属性数据的匹配等 2、基于空间关系和属性特征查询 传统的SQL并不能处理空间查询,对GIS而言,需要对SQL进行扩展,主要包括空间数据与属性数据的匹配等 3、地址匹配查询 根据街道的地址来查询事物的空间位置和属性信息是GIS特有的一种查询功能,这种查询利用地理编码,输入街道的门牌号,就可以知道大致的位置和所在的街区。
(2)、空间信息量算-1 几何量算 1.长度 线状物体的长度是最基本的形态参数之一,在矢量数据格式下,线由点组成,线状物体表示为一个坐标串(Xi, Yi),而线长度可由两点间直线距离相加得到。则线状物体长度的计算公式为:
(2)、空间信息量算-1 几何量算 2.面积 多边形的面积是一个重要指标。多边形边界可以分解为上下两半,其面积就是上半边界下的积分值与下半边界下的积分值之差。设面状物体的轮廓边界由一个点的序列P1 (x1 , y1), P2 ( x2, y2 ), …,Pn (xn, yn)表示,其面积为:
(2)、空间信息量算-1 几何量算 Y 2.面积 S S2 å = + n i y x S 1 2 S1 o X S=S2-S1
(2)、空间信息量算-1 Y (X5,y5) (X1,y1) (X4,y4) (X2,y2) S1 (X3,y3) o X S1=(x2-x1)(y1+y2)/2+ (x3-x2)(y2+y3)/2 + (x4-x3)(y3+y4)/2 + (x5-x4)(y4+y5)/2
(2)、空间信息量算-1 形状量算 面状地物形状量测包括空间一致性问题,即有孔多边形和破碎多边形的处理;多边形边界特征描述问题 当把城市作为单个面状目标看待时,可以直接使用面状目标的形状系数,如形状率、圆形率、紧凑度等,这些指标计算较简单,但只反映一个抽象的形状; 当把城市作为面状目标的集合看待时,可以使用放射状指数、标准面积指数等形状系数,这些指标计算较复杂,但反映了城市内部的具体联系。在多数指标中,都以圆形作为城市的标准形状。
(2)、空间信息量算-1 欧拉数 =(孔数)-(碎片数-1) 欧拉数 空间一致性最常用的指标是欧拉函数,用来计算多边形的破碎程度和孔的数目。
(2)、空间信息量算-1 1)形状比(FORM RATIO) 形状比=A/L2 其中,A为区域面积,L为区域最长轴的长度。 该指标能反映城市的带状特征,城市的带状特征越明显则形状比越小。显然,如果城市为狭长带状分布,其长轴两端的联系是不便捷的。
(2)、空间信息量算-1 伸延率=L/ L’ 式中,L为区域最长轴长度,L’为区域最短轴长度。 2)伸延率(ELONGATION RATIO) 伸延率=L/ L’ 式中,L为区域最长轴长度,L’为区域最短轴长度。 该指标反映城市的带状延伸程度,带状延伸越明显则延伸率越大,反映城市的离散程度越大。
(2)、空间信息量算-1 3)紧凑度(COMPACTNESS RATIO) 公式: 紧凑度= P 其中,A为面积,P为周长。 / 2 p 该指标反映城市的紧凑程度,其中圆形区域被认为最紧凑,紧凑度为1。其它形状的区域,其离散程度越大则紧凑度越低。
(2)、空间信息量算-2 质心量算 质心是描述地理对象空间分布的一个重要指标。例如要得到一个全国的人口分布等值线图,而人口数据只能到县级,所以必须在每个县域里定义一个点作为质心,代表该县的数值,然后进行插值计算全国人口等值线 质心通常定义为一个多边形或面的几何中心,当多边形比较简单,比如矩形,计算很容易。但当多边形形状复杂时,计算很复杂
(2)、空间信息量算-2 分两种情况: 1)面状目标的重心。可以理解为多边形内的平衡点,正如一块均质木块被悬挂起来的平衡点。
(2)、空间信息量算-2 面状目标重心可以通过计算梯形重心的平均值而得到。将多边形的各个顶点投影到x轴上,就得到一系列梯形(如图),所有梯形重心的联合就确定了整个多边形的重心。 按梯形计算重心位置
å ∑ = A X / / = A Y 设多边形的顶点序列(xi , yi)按顺时针编 码,则其重心的计算公式为: G A X / 按梯形计算重心位置 ∑ / = i G A Y 其中, 和 是第i个梯形的重心的x坐标和y坐标,是梯形的面积。 它们由下式得到: i Y
ï î í ì - + = 6 / ) )( ( 2 1 i x y A Y X 按梯形计算重心位置
(2)、空间信息量算-3 ∑ 2)面状分布离散目标的重心 = , W Y X 可理解为其分布中心。其重心计算方法是取离散目标的加权平均中心,它是离散目标保持均匀分布的平衡点。 计算公式为: ∑ = , i G W Y X 其中,i为离散目标物,Wi为该目标物权重。Xi与Yi为其坐标。
(2)、空间信息量算-3 距离量算 “距离”是人们日常生活中经常涉及到的概念,它描述了两个事物或实体之间的远近程度。最常用的距离概念是欧氏距离,无论是矢量结构,还是栅格结构都很容易实现 在GIS中,距离通常是两个地点之间的计算,但有时人们想知道一个地点到所有其它地点的距离,这时得到的距离是一个距离表面
(2)、空间信息量算-3 各向同性和各向异性的距离表面
欧氏距离、曼哈顿距离和一种非欧氏距离
2.空间变换 基于栅格结构的空间变换可分为三种方式: 为了满足特定空间分析的需要,需对原始图层及其属性进行一系列的逻辑或代数运算,以产生新的具有特殊意义的地理图层及其属性,这个过程称为空间变换。 矢量数据结构空间变换复杂繁琐,栅格数据结构空间变换容易。 基于栅格结构的空间变换可分为三种方式: 单点变换:假定运算不受其他邻点属性影响。 邻域变换:考虑邻域单元的影响,平滑,坡度,坡向分析等。 区域变换:考虑整个变换区域的属性影响,如整体插值,求和,归组
3.再分类 再分类(Reclassification):根据不同的需要对原始数据再次进行分类和提取的过程。
3.再分类 基于非空间属性分类可用经典的数理统计算法,如主成分分析、层次分析、聚类分析、判别分析,不改变已有属性,仅根据属性,划分到相应的类别中。 矢量数据结构:点、线地物直接修改属性表中的数值实现。面状地物属性修改需同时修改几何形状和属性(去公共边界,属性统一)。 栅格数据结构:点线面均通过修改属性值并改变图例表示。 归组:最常用和最简单的再分类。
ArcGIS中3D分析和空间分析工具条中都有再分类工具
4.缓冲区分析 1、概念 邻近度:描述了地理空间中两个地物距离相近的程度,其确定是空间分析的一个重要手段。 交通沿线或河流沿线的地物有其独特的重要性,公共设施的服务半径,大型水库建设引起的搬迁,铁路、公路以及航运河道对其所穿过区域经济的发展的重要性等,均是一个邻近度问题。 缓冲区分析是解决邻近度问题的空间分析工具之一。
4.缓冲区分析 缓冲区:地理空间目标的一种影响范围或服务范围。 缓冲区分析:是指根据分析对象的点、线、面实体,自动建立其周围一定距离的带状区,用以识别这些实体或者主体对邻近对象的辐射范围或者影响程度,是解决临近度问题的空间分析工具之一。 它在交通、林业、资源管理、城市规划中有着广泛的应用。 例如:湖泊和河流周围的保护区的定界;汽车服务区的选择;民宅区远离街道网络的缓冲区的建立等。
4.缓冲区分析 2 缓冲区主要的类型 (1)基于点要素的缓冲区:通常以点为圆心、以一定距离为半径的圆 (2)基于线要素的缓冲区:通常是以线为中心轴线,距中心轴线一定距离的平行条带多边形。 (3)基于面要素的缓冲区:向外或向内扩展一定距离以生成新的多边形。
点、线、多边形的缓冲区 另外,还有特殊形态的缓冲区,如点对象有三角形、矩形、圆形;线对象有双侧对称,双侧不对称或是单侧缓冲区,对于面对象有内侧和外侧缓冲区。
第七节 缓冲区分析 不同缓冲区宽度时的处理图示
4.缓冲区分析 3 空间缓冲区分析过程 (1)建立缓冲区 以图形元素为基础,拓宽或紧缩一定宽度而形成的区域。这个宽度通常是等距的,也可以是不等距的缓冲区。 (2)缓冲区分析 根据建立的缓冲区,对缓冲区内的空间信息形态、特征、分布作进一步分析。
4.缓冲区分析 栅格缓冲区的建立 将栅格数据表示为一个二值(0,1)矩阵(M×N),其中“0”像元为空白位置,“1”元素为空间物体所占据的位置。经过距离变换,计算出每个“0”元素与最近的“1”元素的距离,即背景像元与空间物体的最小距离。假设缓冲区的宽度为d,则缓冲区边界就是距离为d的各个背景像元的集合。
4.缓冲区分析 矢量缓冲区的建立 矢量缓冲区常见的有角平分法。角平分法由三步组成,即逐个线段计算简单平行线,尖角光滑矫正和自相交处理。尖角光滑矫正除角平分线法之外,还可采取圆弧法,但矫正过程都很复杂,难以完备地实现。
矢量缓冲区计算的基本问题是双线问题 。 角分线法 难以保证双线的等宽性
凸角圆弧法 d=r/sin(B/2) B d R 保证了平行曲线的等宽性
折点凸凹性的判断 把相邻两个线段看成两个向量,其方向取坐标点序方向。若前一个向量以最小角度转向第二个向量时呈逆时钟方向,则为凸顶点。反之为凹顶点
折点凸凹性的判断 b a AB=(XB-XA,YB-YA) BC=(XC-XB,YC-YB) S=AB × BC =(XB-XA)(YC-YB)-(XC-XB)(YB-YA) S>0, ABC呈逆时钟,顶点为凸。 S<0, ABC呈顺时钟,顶点为凹。 S=0, ABC共线。
缓冲取边线的自相交 复杂对象或对象集合的缓冲区边线可能自相交。右图就是一个例子。 当轴线的弯曲空间不允许双线的边线无压的通过时,就会产生若干个自相交多边形。
重叠多边形与岛屿多边形 岛屿多边形是缓冲区边线的有效组成部分;重叠多边形不是缓冲区边线的有效组成部分,不参与缓冲区的最终构建。 重叠多边形
重叠多边形与岛屿多边形的自动判别 首先定义轴线坐标点序为其方向,缓冲区双线分成左右边线,左右边线自相交多边形的判别情形恰好相反。 对于左边线,岛屿自相交多边形呈逆时钟方向。重叠自相交多边形呈顺时钟方向。
重叠缓冲区的处理图示
4.缓冲区分析 4、缓冲区分析的三要素 在进行空间缓冲区分析时,通常要将研究的问题抽象为以下三类要素: ①主体 ①主体 表示分析的主要目标,一般分为点源、线源和面源三种类。 ②邻近对象 表示受主体影响的客体,例如行政界线变更时所涉及的居民区、森林遭砍伐时所影响的水土流失范围等。 ③对象的作用条件 表示主体对邻近对象施加作用的影响条件或强度。
4.缓冲区分析 5 空间缓冲区分析实例 缓冲区分析实例1 5 空间缓冲区分析实例 缓冲区分析实例1 已知一伐木公司,获准在某林区采伐,为防止水土流失,规定不得在河流周围 1km 内采伐林木。另外,为便于运输,决定将采伐区定在道路周围 5km 之内。请找出符合上述条件的采伐区,输出森林采伐图。 道路分布图 森林分布图 河流分布图 结束 生成道路周围 5km缓冲区 叠置 生成河流周围 1km缓冲区 解题过程 首先要以区域的道路分布图、河流分布图、森林分布图为数据源。解题流程见图所示。 解题流程
将上述3张图进行两两叠置,所得结果即为森林采伐图。 4.缓冲区分析 将该地区具有相同比例尺且进行配准的道路分布图、河流分布图、森林分布图,进行预处理和数字化; 利用河流分布图生成1km的等距离缓冲区; 利用道路分布图生成5km的等距离缓冲区; 森林分布图中可采伐林地、道路缓冲区及河流缓冲区图进行叠置,叠置条件表达式为: 采伐区 =森林分布图中可伐林地 ∩ 道路周围5km缓冲区 ∩非河流周围1 km缓冲区 将上述3张图进行两两叠置,所得结果即为森林采伐图。
4.缓冲区分析 缓冲区分析实例2 如已知一湖泊,要求在它周围5000m 内必需禁止任何污染性工业企业存在,在它周围500m 内必需禁止建筑任何永久性建筑物。 解题步骤: (1)先建立缓冲区; (2)同现有污染性工业企业图叠置,显示在范围内应禁止的污染性工业企业; (3)同现有永久性建筑物图叠置,显示在范围内应禁止的永久性建筑物。
4.缓冲区分析 缓冲区分析实例4 如已知流域水系图,要求计算在它周围5公里内所有建筑物,以便进行分析。 (1)先建立缓冲区; 解题步骤: (2)同现有污染性工业企业图叠置,显示在范围内应禁止的污染性工业企业; (3)同现有永久性建筑物图叠置,显示在范围内应禁止的永久性建筑物。
4.缓冲区分析 ARC/INFO命令: Buffer <in_cover> <out_cover> {buffer_item} {buffer_table} {buffer_distance} {fuzzy_tolerance} {LINE | POLY | POINT | NODE} {ROUND | FLAT} {FULL | LEFT | RIGHT} 对于本例: Buffer buffer bufferline # # 5000 1 line flat
5.叠加分析 大部分GIS软件以分层的方式组织地理景观,将地理景观按主题分层提取,同一地区的整个数据层集表达了该地区地理景观的内容。每个主题层可以用矢量结构的点线面图层文件表达,也可以用栅格结构的图层文件进行表达。 叠加分析是GIS最常用的提取空间隐含信息的手段之一。该方法来源于传统的透明材料叠加。既将来自不同数据源的图纸绘于透明纸上,在透光桌上将其叠放在一起,然后用笔勾出感兴趣的部分。
5.叠加分析 叠加分析 :将有关主题层组成的数据层面,进行叠加产生一个新数据层面的操作,其结果综合了原来两层或多层要素所具有的属性。 也就是说,叠加分析不仅生成了新的空间关系,还将输入数据层的属性联系起来产生了新的属性关系。叠加分析是对新要素的属性按一定的数学模型进行计算分析,进而产生用户需要的结果或回答用户提出的问题。
5.叠加分析 分为以下三类 视觉信息叠加 矢量数据叠加 点与多边形叠加 线与多边形叠加 多边形叠加 栅格图层叠加
5.叠加分析 一、视觉信息叠加 视觉信息叠加不产生新的数据层面,只是将多层信息复合显示,便于分析 视觉信息叠加是将不同侧面的信息内容叠加显示在结果图件或屏幕上,以 便研究者判断其相互空间关系,获得更为丰富的空间信息。 地理信息系统中视觉信息叠加包括以下几类: 点状图,线状图和面状图之间的叠加显示 面状图区域边界之间或一个面状图与其他专题区域边界之间的叠加 遥感影象与专题地图的叠加 专题地图与数字高程模型(DEM)叠加显示立体专题图 视觉信息叠加不产生新的数据层面,只是将多层信息复合显示,便于分析
5.叠加分析 二、基于矢量数据的叠置分析 基于矢量数据的叠置分析是参与分析的两个图层的要素均为矢量数据。 点面叠置分析 线面叠置分析 面面叠置分析
5.叠加分析 矢量数据——点与多边形叠加 点与多边形的叠加分析,实质是计算包含关系(包含分析),判断各个点的归属(落在哪个多边形内)。叠置的结果是为每点产生一个新的属性。例如,井位与规划区叠加,可找到包含每个井的区域。
5.叠加分析 矢量数据——点与多边形叠加 在完成点与多边形几何关系计算后,还要进行属性信息处理。最简单的方式是将多边形属性信息叠加到其中的点上(或反之)。如有多点分布在同一多边形,则要采取一些特殊的规则。 点与多边形的叠加通常不产生新的数据层,只是把属性信息叠加到原图层中,然后通过属性查询间接获得点与多边形叠加的需要信息。
例如:将水井与规划区图层相叠置,可确定每口井 所属的规划区范围。 矢量数据——点与多边形叠加 例如:将水井与规划区图层相叠置,可确定每口井 所属的规划区范围。 多边形 属性1 属性2 A B C D 点 属性 1 2 3 4 *2 *1 *3 *4 点 多边形 点属性 面属性1 面属性2 1 A 2 D 3 C 4 B A D B C
5.叠加分析 矢量数据——线与多边形叠加 线与多边形的叠置是将线状要素层或网状要素层和多边形叠置,对线和多边形求交运算,根据每个线要素同多边形的关系,以形成新的空间目标集、新的属性表,得到线与多边性联合的属性表。 线与多边形的叠合的目的是确定某一线状图层上的弧段落在另一多边形图层上的哪个多边形内,以便为图层的每条弧段建立新的属性。
5.叠加分析 例如:当确定某一行政区内各种等级道路的里程数时,就需要将道路图与境界图相叠置,计算弧段与多边形边界的交点,在交点处截断弧段,并对弧段重新编号,建立弧段与多边形的归属关系。 线与多边形叠置分析
5.叠加分析 矢量数据——多边形与多边形的叠加分析 多边形叠加分析也称为Polygon-on-polygon 叠置,它是指同一地区、同一比例尺的两组或两组以上的多边形要素的数据文件进行叠置。参加叠置分析的两个图层应都是矢量数据结构。 若需进行多层叠置, 也是两两叠置后再与第三层叠置,依次类推。其中被叠置的多边形为本底多边形,用来叠置的多边形为上覆多边形,叠置后产生具有多重属性的新多边形。
矢量数据的多边形叠置分析
5.叠加分析 多边形与多边形的叠置原理 多边形与多边形的叠置是指将两个不同图层的多边形要素相叠加,根据两组多边形的交点来建立多重属性的多边形或进行多边形范围内的属性特征的统计分析。 多边形叠置过程分几何求交过程和属性确定过程,算法的核心是多边形求交。 ①对两个多边形进行边界求交和弧段分割运算,并以新弧段为单位重建拓扑关系; ②判断重建多边形落在原始多边形层的哪个多边形内,从而建立新叠置多边形与原始多边形的关系,并抽取属性。
矢量数据的多边形叠置分析 多边形叠加分析
5.叠加分析 多边形的叠置流程图 取本底多边形 取上叠多边形 两个多边形相交? 两个多边形是包含关系? 多边形求交,重建拓扑关系 属性抽取,建立关联连接 上叠多边形结束? 本底多边形结束? y n 建立包含关系 属性抽取 结束 多边形的叠置流程图
矢量数据的多边形叠置分析 多边形叠置就是地理数据层的叠加,分为合成叠置与统计叠置。 合成叠置是将同一地区、同一比例尺的两组或更多的多边形要素的数据文件进行叠置,根据两组多边形边界的交点来建立具有多重属性的多边形,如图(a)。 统计叠置是将多边形数据层叠加,进行多边形范围的属性特征的统计分析,如图(b)。
5.叠加分析 合成叠置 统计叠置 (a)合成叠置 (b)统计叠置
多边形叠加产生碎屑多边形 多边形叠加产生碎屑多边形
多边形与多边形的叠置分析功能 并(Union):保留两个输入层中所有多边形; 判断(Identity):输出以其中一输入图层为界的边界内的所有多边形 交(Intersect):保留两个输入层中的公共区域
参考:黄杏元.地理信息系统概论(修订版),第五章第2节,空间叠合分析相关内容。 删除(Erase):输出层为保留以其中一输入图层为控制边界之外的所有多边形。即:在将更新的特征加入之前,须将控制边界之内的内容删除。 更新(Update):输出层为一个经删除处理后的图层与一个新特征图层进行合并后的结果 切割(Clip):输出层为按一个图层的边界,对另一个图层的内容要素进行截取后的结果。 参考:黄杏元.地理信息系统概论(修订版),第五章第2节,空间叠合分析相关内容。
逻辑判断叠置法 A B C A.AND.B.AND.C A.NOT.(B.AND.C) A.AND.B.OR.C A.OR.B.OR.C A.XOR.B.XOR.C A.AND.(B.OR.C)
5. 空间叠加 叠置分析实例:有日喀则地区的行政界线图层和通过遥感技术提取的该区沙漠化类型分布图层,求日喀则地区各县沙漠化类型统计数据。 5. 空间叠加 叠置分析实例:有日喀则地区的行政界线图层和通过遥感技术提取的该区沙漠化类型分布图层,求日喀则地区各县沙漠化类型统计数据。 图层1 图层2 日喀则地区行政区界线图 日喀则地区沙漠化类型分布图
5. 空间叠加 图层1:图形,属性表 行政区界图属性表 日喀则地区行政区界线图
5. 空间叠加 图层2:图形,属性表 日喀则地区沙漠化类型分布图属性表 日喀则地区沙漠化类型分布图
5. 空间叠加 使用IDENTITY命令,进行两图层空间叠置,得到叠置图 叠置图属性表 空间叠置图
5. 空间叠加 图层1属性表 叠置图层属性表 图层2属性表
5. 空间叠加 三、基于栅格数据的叠置分析 数学运算叠置法 :算术运算、函数运算 算术运算指两层以上的对应网格值经加、减运算,而得到新的栅格数据系统的方法。 1 1 1 A B C 1 2 3 1 1 3 D=A+B+C E=|A-B| F=D-E
5. 空间叠加 三、基于栅格数据的叠置分析 基于栅格数据的叠置分析是参与分析的两个图层的要素均为栅格数据。 特点:栅格数据的叠置算法,虽然数据存贮量比较大,但运算过程比较简单。 变换方法: (1)点变换 (2)区域变换方法 (3)邻域变换方法
5. 空间叠加 (1)点变换 点变换只依据参与叠置图层相应点的属性值进行新的运算,既与各图层的邻域点的属性无关,也不受区域内一般特征的影响。 运算方法包括: 算术运算,指数运算,三角函数运算等
5. 空间叠加 - = 点变换示意 结果特征:运算后得到的新属性值可能与原图层的属性意义完全不同。 2 5 4 3 6 2 4 6 3 7 -2 1 -1 2 - = 结果特征:运算后得到的新属性值可能与原图层的属性意义完全不同。
5. 空间叠加 (2)区域变换方法 指在计算新图层相应的属性值时,不仅与原图层对应的栅格的属性值有关,而且要顾及原图层所在区域的集合特征(区域长度、面积、周长等)。 (3)邻域变换方法 指在计算新图层相应的属性值时,不仅考虑原图层对应的栅格及其属性,而且还应顾及与该栅格相关联的邻域或者影响半径内的栅格属性值的影响。
5. 空间叠加 - = 点变换实例1:土地利用变化区域探测 80年遥感影像 90年遥感影像 点变换后影像 Legend 点变换后影像分析 10 60 30 10 60 20 30 10 - = Legend 点变换后影像分析 通过80和90年两期影像的相减运算后得到变换影像,如果: 变换影像值 = 0;说明该区未发生变化 变换影像值 ≠ 0;说明该区已发生变化 10 耕地 20 居民点 30 水域 40 草地 50 未利用地 60 林地 注意:此处的遥感影像可以是分类结果,也可以是原始的遥感影像。 在一般应用中,多使用原始的遥感影像,可提高变化探测速度。
5. 空间叠加 点变换实例2:土地利用变化分析 信息获取 研究方法 变化过程分析 机制分析 更新土地利用图 社经统计数据 动态变化研究 变化信息的解译与制图 变化数据管理 原始遥感信息 专题图件 数据预处理 空间操作与分析 图像预处理 影像分类 变化信息探测 结果比较 变化信息分类 高分辨率图像融合 土地利用/覆盖动态变化研究框架 信息获取 研究方法 变化过程分析 机制分析
5. 空间叠加 信息获取 1985年(TM) 1995年(TM) 1998年(SPOT) 2000年(TM) 不同时期土地利用图
使用景观生态学方法,计算土地类型转移矩阵。 5. 空间叠加 研究方法 使用景观生态学方法,计算土地类型转移矩阵。 土地类型转移矩阵: 根据两个不同时间(t和t+△t)的土地利用图计算从一种类型到另一种类型的转换概率,来分析土地利用变化过程。它依靠GIS技术,将两个不同时间的土地利用图进行删格化处理,计算t时刻上A类有多少格网点转换成在t+△t时刻的B,C,D等类型,转换点数占该类型总数的百分比可称为转移概率。
5. 空间叠加 对任意两期土地利用类型图 和 ,按照下式的地图代数方法,可以求得: 对任意两期土地利用类型图 和 ,按照下式的地图代数方法,可以求得: 由 k 时期到 k+1 时期的土地利用变化图 Ci×j,它表现了土地利用变化的类型及其空间分布。
5. 空间叠加 1 2 ┄ n ai+ a11 a12 a1n a1+ a21 a22 a2n a2+ ┆ N an1 a32 ann 类型转移距阵示例 1 2 ┄ n ai+ a11 a12 a1n a1+ a21 a22 a2n a2+ ┆ N an1 a32 ann an+ a+j a+1 a+2 a+n a 注:表中 ai+ 代表土地类型 I 在转化前的总量;a+j 代表土地类型 I在转化后的总量;a 是土地总面积
5. 空间叠加 变化过程分析
5. 空间叠加
5. 空间叠加
栅格叠置分析示例 土地利用 地形坡度 人口密度 交通便利度 得 分 方面1 方面2 方面3 方面4 自然保护区 组 合 适宜性
6.网络分析 网络数据结构的基本组成部分和属性 1、链(Link) 网络中流动的管线如街道、河流、水管,其状态属性包括阻力和需求。 2、结点(Node) 网络中链的结点,如港口、车站等,其状态属性包括阻力和需求等。
结点中的特殊类型 障碍(Barrier),禁止网络上流动的点。 拐点(Turn),出现在网络中的分割点上,其状态有属性和阻力,如拐弯的时间和限制(如在8点到18点不允许左拐)。 中心(Center),是接受或分配资源的位置,如水库、商业中心,电站等,其状态包括资源容量(如总量),阻力限额(中心到链的最大距离或时间)。 站点(Stop),在路径选择中资源增减的结点,如库房、车站等,其状态属性有资源需求,如产品数量。
路径分析 静态求最佳路径:在给定每条链上的属性后,求最佳路径。 N条最佳路径分析:确定起或终点,求代价最小的N条路径,因为在实际中最佳路径的选择只是理想情况,由于种种要素而要选择近似最佳路径。 最短路径或最佳耗费路径:确定起点终点和要经过的中间点、中间连线,求最短路径或最佳耗费路径。 动态最佳路径分析:实际网络中权值是随权值关系式变化的,可能还会临时出现一些障碍点,需要动态的计算最佳路径。
int result=FindMin(array,7); 最小值问题求解 如:有数组int Array[n](Array[i]<1000,i=0,n), 如何找出它们之中的最小值? int FindMin(int *array, int bound) { int min=1000; for(int i=0;i<bound;i++) if(array[i]<=min) min=array[i]; return min; } …… int array[7]={789,33,7898,7565,76,22,88}; int result=FindMin(array,7); ASSERT(result = =22)
最佳路径求解 最佳路径求解有多种不同的方法,其中Dijkstra算法适合于求解某个起点(源点)到网络中的其它各个结点的最佳路径。
1、引进一个辅助向量D,它的每个分量D[i]表示当前所找到的从起点 vm 到每个终点vi的最短路径的长度。 Dijkstra算法(1) 1、引进一个辅助向量D,它的每个分量D[i]表示当前所找到的从起点 vm 到每个终点vi的最短路径的长度。 假设用带权的邻接矩阵arcs来表示带权有向图,arcs[i][j]表示弧 <vi, vj >上的权值。 若 <vi,vj >不连通,则arcs[i][j]=∞。 那么D[i]的初值为:D[i]=arcs[m][i] vi∈V 此外,将已找到的从vm 出发的最短路径的终点的集合记为S,它的初始状态为空集。
D[j]=Min{D[i] | vi∈V-S} Dijkstra算法(2) 2、选择 vj 使得 D[j]=Min{D[i] | vi∈V-S} Vj就是当前求得的一条从vm出发的最短路径的终点。其中j为这条最短路径的终点,将其加入到终点集合S,令 S = S ∪{j}
Vm Vk Vj Dijkstra算法(3) 3、修改辅助向量D,即修改从vm出发到集合V-S上任一顶点vk可达的最短路径长度。 显然,若D[j]+arcs[j][k]<D[k],则表明从vm出发,经过vj到达vk的路径更短。因此,如果D[j]+arcs[j][k]<D[k],则修改D[k]为 : D[k]=D[j]+arcs[j][k] V-S D[k]= 15 Vm Vk D[j] =5 arcs[j][k]= 8 Vj S
Dijkstra算法(4) 4、重复操作第二步、第三步共n-1次。由此求得从v到图上其余各顶点的最短路径是依路径长度递增的序列。
例子 V5 V0 V4 V1 V3 V2 100 60 30 10 50 5 20 带权有向图 邻接矩阵
例子(思路) Bi Ci A 如图所示,A为所求最短距离的起点,其他Bi, Ci 为终点。 我们要求的是一系列最短距离。我们先假定这些最短距离互不相等。那么我们可以把这些最短距离按升序(从小到大)排列。 我们把所有顶点分为两类C和B.令A到Bi这些顶点的最短距离不为无穷大。 A到Ci这些顶点的最短距离为无穷大。 这就说明A到Ci中的点要么不通,要么通过Bi中的点与之连接。 Bi Ci
例子(思路) A Bi Ci (因为:A到Ci中的点要么不通,要么通过Bi中的点与之连通。 ) 因此,我们可以先不考虑Ci中的点。 这样,对于A到Ci中任何一个点的最小距离,我们总可以在Bi中找到一点,使得A到这一点的最小距离小于前一个距离。 (因为:A到Ci中的点要么不通,要么通过Bi中的点与之连通。 ) 因此,我们可以先不考虑Ci中的点。 Bi Ci
例子(思路) V5 V0 V4 V1 V3 V2 100 60 30 10 50 5 20 于是,对于右图,我们第一步只考虑下图: V5 100 V0 30 V4 10 Bi={v2,v4,v5} V2
V5 V0 V4 V1 V3 V2 100 60 30 10 50 5 20 例子(思路) 我们用mindist[]这个数组来保存由v0到其它顶点的最小距离,这些距离按升序排列。 考虑右图: 第一步,通过比较,我们知道 mindistance[v0][v2]=mindist[0]=10,(v0-v2),这是我们求出的第一个最小距离。 一旦我们得到v2,我们就可以知道: V5 V0 V4 V2 100 30 10
例子(思路) 30 V5 100 V4 V0 10 V3 V2 50 Bi={v2,v4,v5,v3} 60 30 10 50 5 20 例子(思路) V0跟 v2直接连通到的点v3 之间的最小距离不再是无穷大,它应当是mindistance[v0][v2]+dis[v2][v3], 这样我们应当把v3放入前面的集合Bi中。 (注意:有多少v2直接连通到的点都应当考虑进来。) V5 V0 V4 V3 V2 100 30 10 50 Bi={v2,v4,v5,v3}
例子(思路) 30 V5 100 V4 V0 10 V3 V2 50 第二步,我们把与v2直接连通的点v3考虑进来。 dis[0][5]=100; dis[0][4]=30; dis[0][2]=10; dis[0][3]=60; 除10以外,30是最小的。 我们可以证明30是v0到其它顶点除10以外最小的。 V5 V0 V4 V1 V3 V2 100 60 30 10 50 5 20
Bi 例子(思路) 30 V5 100 V4 V0 10 V3 V2 50 Vn 不可能存在这样一个点Vn,使得 10<mindistance[0][n]<30. 原因如前所述。 V5 V0 V4 V1 V3 V2 100 60 30 10 50 5 20 Vn
Bi 例子(思路) 30 V5 100 V4 V0 10 Vn V3 V2 50 不可能存在这样一个点Vn,使得 10<mindistance[0][n]<30. 原因如前所述。 Vn V5 V0 V4 V1 V3 V2 100 60 30 10 50 5 20
Bi 例子(思路) V5 V5 这样我们得到我们的第二个最小距离: Mindistance[v0][v4]=mindist[1]=30 ,(v0-v4) 接下来,我们把v4与之直接连通的点考虑进来。。。 100 100 V0 V0 30 30 V4 V4 10 10 V3 V3 V2 V2 50 50 V5 V0 V4 V1 V3 V2 100 60 30 10 50 5 20
例子 以v0为起点,计算它到其它各顶点的最短路径,计算过程中最短路径长度向量D的变化见D0-D4,计算出的各条最短路径见表4-4。 ú û ù ê ë é ¥ = 100 30 10 D
例子 终点 从v0到其它各结点的最短路径 v1 ∞ v2 10 (v0, v2) v3 60 (v0, v2,v3) 50 100 60 30 10 50 5 20 例子 终点 从v0到其它各结点的最短路径 v1 ∞ v2 10 (v0, v2) v3 60 (v0, v2,v3) 50 (v0, v4,v3) v4 30 (v0, v4) v5 100 (v0, v5) 90 (v0, v4,v5) (v0, v4,v3,v5) vj
例子 10 起点 终点 最短路径 路径长度 v0 v1 无 v2 (v0,v2) v3 (v0,v4,v3) 50 v4 (v0,v4) 100 60 30 10 50 5 20 例子 起点 终点 最短路径 路径长度 v0 v1 无 v2 (v0,v2) 10 v3 (v0,v4,v3) 50 v4 (v0,v4) 30 v5 (v0,v4,v3,v5) 60
求最短路径的方法
第六节 空间网络分析(2) 2、地址匹配 地址匹配实质是对地理位置的查询,它涉及到地址的编码(Geocode)。地址匹配与其他网络分析功能结合起来,可以满足实际工作中非常复杂的分析要求。 所需输入的数据,包括地址表和含地址范围的街道网络及待查询地址的属性值。
第六节 空间网络分析(3) 3、资源分配 资源分配网络模型由中心点(分配中心)及其状态属性和网络组成。 资源分配的两种方式: (1)由分配中心向四周输出 (2)由四周向中心集中 这种分配功能可以解决资源的有效流动和合理分配,其在地理网络中的应用与区位论中的中心地理论类似。
涉及资源分配的中心选址问题 中心点选址问题中,最佳选址位置的判定标准,是使其所在的顶点与图中其它顶点之间的最大距离达到最小。 这个选址问题实际上就是求网络图的中心点问题。这类选址问题适宜于医院、消防站、超市、学校等服务设施的布局问题。
中心选址问题的图论描述 设G=(V,E)是一个无向赋权连通图,其中V={v1,v2,…,vn},E={e1,e2,…,en}。连接两个顶点的边的权值代表该两顶点之间的距离。对于每个顶点vi,它与各顶点之间的最短路径长度为di1,di2,…,din。顶点vi的最大服务距离是这几个最短路径长度中的最大值,记为e(vi0)。 e(vi0)=max(di1,di2,…,din) 那么,中心点选址问题,就是求图G的中点vi0,使得该顶点的最大服务距离达到最小,即 e(vi0)=min{e(vi)}
中心选址问题的实例 例如 某县要在其所辖的8个乡镇之一修建一个消防站,为8个乡镇服务,要求消防站至最远乡镇的距离达到最小。假设该8个乡镇之间的交通网络被抽象为图所示的无向赋权连通图,权值为乡镇之间的距离。下面求解消防站应设在哪个乡镇,即哪个顶点?
中心选址问题的实例 v6 v8 v1 v5 v4 v2 v3 9 3 6 2 5 7 v7 8
首先,用Dijkstra算法计算出每一个顶点vi至其它各顶点vj的最短路径长度dij(i, j=1,2,…,6),写出距离矩阵: 中心选址问题的实例 首先,用Dijkstra算法计算出每一个顶点vi至其它各顶点vj的最短路径长度dij(i, j=1,2,…,6),写出距离矩阵:
中心选址问题的实例 其次,求距离矩阵中每行的最大值,即各个顶点的最大服务距离,得 e(v1)=14, e(v2)=15, e(v3)=20, e(v4)=12, e(v5)=15, e(v6)=17, e(v7)=12, e(v8)=20 最后计算最大服务距离的最小值。显然,e(v4) = e(v7) = min{ e(vi)}。所以,消防站应建在v4或v7点所在的乡镇即可。
7.空间插值 概念 空间插值理论假设空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的点,其特征值相似的可能性越小。 空间插值 空间数据的插值即对一组已知空间数据,可以是离散点的形式,也可以是分区数据的形式,要从这些数据中找到一个函数关系式,使该关系式最好地逼近已知的空间数据,并能根据该函数关系式推求出区域范围内其它任意点或任意分区的值。 用于将离散点的测量数据转换为连续的数据曲面。广泛应用于等值线自动制图、数字高程模型的建立、不同区域界线现象的相关分析和比较研究等。 空间插值理论假设空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的点,其特征值相似的可能性越小。
7.空间插值 需要进行空间插值的情况: 现有的离散曲面的分辨率、像元大小或方向与所要求的不符 现有的连续曲面的数据模型与所需的数据模型不符 现有的数据不能完全覆盖所要求的区域范围
7.空间插值 空间插值方法的主要目标 (1)对不足或缺失数据的估计.由于观测台站分布的密度及分布位置的原因,不可能任何空间地点的数据都能实测得到,需要用到插值,以了解区域内观测变量的完整空间分布; (2)数据的网格化.规则格网能够更好地反映连续分布的空间现象,并对他们的变化作出模拟.对已知观测台站的观测数据进行空间内插,便可得到格网化数据; (3)内插等值线.以等值线的形式直观地显示数据的空间分布; (4)对不同分区未知数据的推求 摘自:朱求安, 张万昌, 余钧辉.基于GIS的空间插值方法研究[J].江西师范大学学报(自然科学版), 2004, 28(3),183-188.
7.空间插值 进行空间插值时,一般包括以下过程: (1)空间插值数据源的获取; (2)对数据进行分析,找出源数据的分布特性、统计特性,便于选择最恰当的插值方法; (3)插值方法的选择并进行插值计算; (4)对插值结果的评价; (5)运用多种插值方法进行计算,对各种方法的插值结果进行比较、分析并选择最佳的插值方法. 摘自:朱求安, 张万昌, 余钧辉.基于GIS的空间插值方法研究[J].江西师范大学学报(自然科学版), 2004, 28(3),183-188.
7.空间插值 空间插值的应用: 在对自然科学及社会学科的数据处理中,空间插值往往是一个必不可少的工具,尤其在水文、气象、生态、环境、地质等地学学科以及社会、经济等领域得到了广泛的应用. 数字地面模型是地学研究中重要的分析工具之一,它的生成便依赖于空间插值方法; 在气象气候学中,气象要素(如降水、温度、太阳辐射等)在空间尺度上连续分布的数据,对各类模型的研究有着重要意义,因为各种气象要素的观测站分布往往是稀疏而不均匀的,在各个台站观测的点数据基础上,要推算出空间面上气象要素的分布,空间插值方法是有力的工具; 摘自:朱求安, 张万昌, 余钧辉.基于GIS的空间插值方法研究[J].江西师范大学学报(自然科学版), 2004, 28(3),183-188.
7.空间插值 空间插值的应用: 在生态学上,空间插值可以用来估算生物种群的分布情况,为病虫害的防治与综合治理等方面提供了理论和实践基础; 在地质学上,空间插值方法是探矿及矿藏分布情况的有力分析工具,可以对土壤及所含各种元素的分布情况作出估算,为生产实践提供支持; 可以为环境污染情况及扩散的分析提供辅助手段; 除了地学上,空间插值方法在社会、经济等方面也得到了很好的应用,也渗透到了其它的学科,如医学上通过空间插值构建复杂性动态脑地形图,对一些脑疾病患者脑电数据进行分析等. 摘自:朱求安, 张万昌, 余钧辉.基于GIS的空间插值方法研究[J].江西师范大学学报(自然科学版), 2004, 28(3),183-188.
7.空间插值 空间插值的数据源 摄影测量得到的正射航片或卫星影像 卫星或航天飞机的扫描影像 野外测量采样数据,采样点随机分布或有规律的线性分布(沿剖面线或沿等高线) 数字化的多边形图、等值线图
7.空间插值 空间插值的数据通常是复杂空间变化有限的采样点的测量数据,这些已知的测量数据称为“硬数据”。 如果采样点数据比较少的情况下,可以根据已知的导致某种空间变化的自然过程或现象的信息机理,辅助进行空间插值,这种已知的信息机理,称为“软信息”。 但通常情况下,由于不清楚这种自然过程机理,往往不得不对该问题的属性在空间的变化作一些假设,例如假设采样点之间的数据变化是平滑变化,并假设服从某种分布概率和统计稳定性关系。
7.空间插值 空间点采样的方法: 完全规则采样 当区域景观大量存在有规律的空间分布模式时,会得到片面的结果,如有规律间隔的数或沟渠
7.空间插值 空间点采样的方法: 完全随机采样 随机采样点之间的位置是不相关的 完全随机采样会导致采样点的分布不均,一些点的数据密集,另一点的数据缺少。
7.空间插值 空间点采样的方法: 成层随机采样: 聚集采样: 随机采样和规则采样的结合,即单个的点随机的分布于规则的格网内 用于分析不同尺度的空间变化
7.空间插值 空间点采样的方法: 规则断面采样: 常用于河流、山坡剖面的测量 等值线采样: 是数字化等高线图插值数字高程模型最常用的方法。
7.空间插值 各种不同的采样方式
7.空间插值 用研究区域所有的采样点的数据进行全区特征拟合 空间插值方法 整体插值方法 边界内插方法 趋势面分析 变换函数插值 多元回归分析 其他 局部插值方法 最近邻点法:泰森多边形方法 移动平均插值方法:距离倒数插值 样条函数插值方法 空间自协方差最佳插值方法:克里金插值 用邻近的数据点来估计未知点的值 其中最重要的有线性内插法、双线性插值、趋势面插值、样条插值及克里金(Kriging)插值,这些方法有的是整体拟合,有的是局部拟合。
7.空间插值 空间插值方法的分类 空间插值方法依据不同的标准,有多种不同的分类方法. [1]黄杏元等依据已知点和已知分区数据的不同,可将空间数据插值分为点的内插和区域的内插。 [2]邬伦等则对应分为空间内插和外推两种: 空间内插算法是一种通过已知点的数据推求同一区域其它未知点数据的计算方法; 空间外推算法则是通过已知区域的数据,推求其它区域数据的方法. 摘自:朱求安, 张万昌, 余钧辉.基于GIS的空间插值方法研究[J].江西师范大学学报(自然科学版), 2004, 28(3),183-188.
7.空间插值 空间插值方法的分类 [3]李新等依据空间插值的基本假设和数学本质将空间内插分类为:几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法。 [4] Nigel. M. Waters在他的文章中对各种分类方法进行了概括,包括 :(1)点的插值和面的插值; (2)全局性插值与局部性插值; (3)精确插值和近似插值; (4)统计性插值和确定性插值; (5)渐变插值和突变插值.
7.空间插值 空间插值方法的分类 [4] Nigel. M. Waters的文章还指出: 对于点的插值包括:最近距离法插值,如泰森多边形法,B样条插值,Kriging插值,在经验知识基础上的手工目视插值,趋势面分析法,傅立叶变换及移动距离权重平均法等. 对于面的插值(区域插值)计算,根据在插值过程中是否采用辅助数据将其分为两类:无辅助数据的面插值法和有辅助数据的面插值法.
7.空间插值——整体插值方法 边界内插法 假设任何重要的变换发生在边界上,边界内的变化是均匀的,同质的,即在各方向都是相同的。 这种概念模型经常用于土壤和景观制图,可以通过定义“均质的”土壤单元、景观图斑来表达其他的土壤、景观特征属性
7.空间插值——整体插值方法 在边界内插的实际应用中,应考虑数据源是否符合这些理论假设: 属性值在图斑或景观单元内是随机变化的,不是有规律的 同一类别的所有图斑存在同样的类方差(噪声) 所有的属性值都呈正态分布 所有的空间变化发生在边界上,是突变而不是渐变
7.空间插值——整体插值方法 趋势面分析:某种地理属性在空间的连续变化,可以用一个平滑的数学平面加以描述。这种根据采样点的属性数据与地理坐标的关系,进行多元回归分析得到平滑数学平面方程的方法即趋势面分析。 思路:先用已知采样点数据拟合出一个平滑的数学平面方程,再根据该方程计算无测量值的点上的数据。 该理论假设:地理坐标是独立变量、属性值是独立变量且正态分布,同样回归误差也是与位置无关的独立变量 整体内插主要采用趋势面分析技术。
7.空间插值——整体插值方法 趋势面分析方法适用于:能以空间的视点诠释趋势和残差;观测有限,内插也基于有限的数据. 趋势面是个平滑函数,很难正好通过原始数据点,除非是数据点少且趋势面次数高才能使曲面正好通过原始数据点,所以趋势面分析是一个近似插值方法
7.空间插值——整体插值方法 变换函数插值法 根据一个或多个空间参量的经验方程进行整体空间插值,这种经验方程称为变换函数.变换函数插值法属于近似的空间插值。
7.空间插值——整体插值方法 多元回归分析 多元回归在各种统计方法中,使用较多的是回归分析,其特点是不需要分布的先验知识.多元回归在数学形式上与趋势面很相似,但是它们又有着显著的不同.在多元回归中,存在多重共线性,但它并非内在的,可以通过逐步回归解决
7.空间插值——整体插值方法 其他方法 傅里叶级数法,对于周期性的数据序列,如海浪,可以利用傅里叶级数将它们分解为正弦波和余弦波. 小波变换方法,小波分析是傅立叶分析发展的重大突破,并已经从傅立叶分析独立出来. 傅里叶级数和小波变换方法它们特别是在遥感影象分析方面应用广泛,但它们需要的数据量大.
7.空间插值——局部插值方法 局部插值步骤: 定义一个邻域或搜索范围 搜索落在此邻域范围的数据点 选择表达这有限个点的空间变化的数学函数 为落在规则格网单元上的数据点赋值。重复这个步骤直到格网上的所有点赋值完毕
7.空间插值——局部插值方法 最近邻点法 Thiessen多边形或Voronoi多边形 采用一种极端的边界内插方法,只用最近的单个点进行区域插值。泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其他数据点的距离,并用其内数据点进行赋值。连接所有数据点的连线形成Delaunay三角形,与不规则三角网TIN具有相同的拓扑结构。
7.空间插值——局部插值方法 移动平均插值 距离倒数插值 综合了泰森多边形的邻近点方法和趋势面分析的渐变方法的长处,假设未知点X0属性值是在局部领域内中所有数据点的距离加权平均值。 是加权移动平均方法的一种 距离倒数插值方法是GIS软件根据点数据生成栅格图层的最常见方法。
7.空间插值——局部插值方法 样条函数插值 样条函数是一个分段函数,进行一次拟合只有与少数点拟合,同时保证曲线段连接处连续。 因此样条函数可以修改少数数据点配准而不必重新计算整条曲线,插值速度快,能够保留局部的变化特征。 缺点是其误差不能直接估算。并且在实际中还要解决样条块的定义及如何在三维空间中将这些块拼成复杂曲面,又不引入原始曲面中所没有的异常现象等问题。
7.空间插值——局部插值方法 样条函数插值 常用样条函数是三次样条函数,用于三维情况,此时进行的是曲面内插。 采用三次曲面来描述格网内的内插值时,则待定点内插值ZP为: ZP= a1x3y3+a2x2y3+a3xy3+a4y3+a5x3y2 +a6x2y2+a7xy2+a8y2+a9x3y+a10x2y+ a11xy+a12y+a13x3+a14x2+a15x+a16。
7.空间插值——局部插值方法 样条函数插值 B样条函数 是感兴趣区间以外均为零的其他样条的和,可按简单的方法用地磁多项式进行局部拟合。 常用于数字化的线划在显示之前进行平滑处理,例如土壤、地质图上的各种边界,传统的制图总希望绘出较平滑的曲线。存在的问题是平滑之后周长和面积的计算与平滑前不同。
7.空间插值——局部插值方法 克里金插值 又叫空间自协方差最佳插值方法 该方法充分吸收了地理统计的思想,认为任何在空间连续性变化的属性是非常不规则的,不能用简单的平滑数学函数进行模拟,可以用随机表面给予较恰当的描述。这些连续性变化的空间属性称为“区域性变量”,如像气压、高程、及其他连续性变化的描述指标变量。这种应用地理统计方法进行空间插值的方法被称为克里金(Kriging)插值。
7.空间插值——局部插值方法 克里金插值 Kriging插值方法在空间相关范围分析的基础上,用相关范围内的采样点来估计待插点属性值。 (1)数据检验与分析,删去明显偏离实际的采样数据点。 (2)数据预处理。 (3)绘制方差图,了解空间变量的集聚范围与方向。 (4)克里金插值估计。 相对来说,克里金插值则能较好地反映各种地形变化,但克里金方法的计算量很大,因此在对大面积区域大数据量内插时,这是一个不能不考虑的因素。
7.空间插值——局部插值方法 线性内插法 用线性曲面方程Zp=b0+b1x+b2y拟合待定点附近的地形面(例如TIN模型中的三角平面可视为线性曲面)。可用3个数据点求解待定系数,然后根据线性曲面方程计算待定点的高程值。
7.空间插值——局部插值方法 双线性插值法 用曲面方程Zp=a0+a1x+a2y+a3xy拟合待定点附近的地形面,也可以表示为 Zp=(ax+b)(cy+d)。 即认为待定点附近的地形面的高程Zp在x轴方向呈线性变化,同时在y轴方向上也呈线性变化。可用待定点附近的4个数据点来计算双线性曲面函数的待定系数,再根据曲面函数计算待定点的高程值。
移动拟合法是用二次多项式来拟合地面高程,即Zp=Ax2+Bxy+Cy2+Dx+Ey+F, 7.空间插值——局部插值方法 移动拟合法 (1) 移动拟合法是用二次多项式来拟合地面高程,即Zp=Ax2+Bxy+Cy2+Dx+Ey+F, 通常把坐标原点平移到待定点之后利用上式,采用待定点为圆心的圆周内6个数据点求解函数的待定系数,然后根据曲面方程计算Zp
7.空间插值——局部插值方法 移动拟合法(2) 当数据点多于6个时,可按最小二乘法求解待定系数。 根据数据点距待定点远近不同,利用“距离越远对插值点的影响越小”的思想,可赋以适当的权值,权重可采用 W=1/di2 W=[(R-di)/di]2 W=exp(-di2/R2) 等形式(其中di为距离,R为采样圆半径),该方法称为按距离加权最小二乘内插法。
7.空间插值——局部插值方法 移动拟合法(3) 首先建立误差方程式: 再根据最小二乘法原理,按vwvT=min的方法,建立方程式求解待定系数。 移动拟合法的结果显示误差分布和地形坡度大小没有特别显著的关系,在地性线地区无法显示出这些转折地地形。
8.空间统计分析 1、常规统计分析 2、空间自相关分析 常规统计分析主要完成对数据集合的均值、总和、方差、频数、峰度系数等参数的统计分析。 空间自相关分析是认识空间分布持征、选择适宜的空间尺度来完成空间分析的最常用的方法。
8. 空间统计分析 I = N — Wij ∑∑Wij ( xi – x )( xj – x ) xi – x * 对于空间自相关分析,目前普遍使用空间自相关系数表示,其计算公式如下 I = N — Wij ∑∑Wij ( xi – x )( xj – x ) xi – x * 其中: N 表示空间实体数目; xi 表示空间实体的属性值; x 是 xi 的平均值; Wij 表示实体 i 与 j 的空间关系,它通过拓扑关系获得。 Wij=1表示空间实体 i 与 j 相邻; Wij =0表示空间实体 I 与 j 不相邻。 I 的值介于 –1 与 1 之间: I=1 表示空间自正相关,空间实体呈聚合分布; I=-1 表示空间自负相关,空间实体呈离散分布; I=0 表示空间实体是随机分布的。
8. 空间统计分析 3、回归分析 回归分析是处理变量之间具有相关关系的一种数理统计方法。 实际上,回归分析和相关分析都是研究和处理变量之间具有相互关系的一种数理统计方法,但它们之间既有联系,又有区别。 在研究对象和内容上两者是相同的,但相关分析主要是研究要素之间的密切程度,并没有严格的自变量和因变量之分;而回归分析则主要是研究变量之间的数学表达形式,因而有自变量和因变量之分,可以通过自变量的值来预测、内插因变量的取值。从这里可以看出,回归分析有预测的性质。
8. 空间统计分析 回归分析的主要内容可概括如下: (1)从影响某一地学过程的许多变量中,找出哪些变量是主要的,哪些变量是次要的,这些变量之间又有什么关系。 (2)从一组空间数据出发,确定这些变量间的定量数学表达式,即回归方程; (3)根据一个或几个变量的值来预测或控制另一个变量的取值; 根据变量的多少,可以把回归分析分为一元回归模型和多元回归模型。变量之间的关系有的是线性关系,有的是非线性关系。
8. 空间统计分析 4、趋势分析 通过数学模型模拟地理特征的空间分布与时间过程,将地理要素时空分布的实测数据点之间的不足部分内插或预测出来。 趋势面是一个光滑的数学曲面,它能够集中地反映空间数据在大范围内的变化趋势。趋势面与实际地学变量构成的空间曲面不同,它只是实际曲面的一种近似值。即实际曲面等于趋势面与残差面之和。 实际曲面=趋势面+残差面 趋势面反映了区域性的变化规律,它受大范围内系统性因素的控制; 残差曲面则反映了局部性的变化特点,这些特点受局部性因素和随机因素的控制。
8. 空间统计分析 趋势面分析的数学表达式 用于计算趋势面的数学表达式有多项式函数和傅立叶级数之分。最常用的是多项式函数。 按多项式函数中自变量的个数,可分为一维、二维、三维趋势面拟合等种类,每一类又可按多项式的系数分为一次、二次、三次、四次、五次等趋势面。 在实际工作中,二维趋势面是一种最常用的方法。
8. 空间统计分析 5、专家打分模型 将相关的影响因素按其相对重要性排队,给出各因素所占的权重值; 对每一要素内部进行进一步分析,按其内部的分类进行排队,按各类对结果的影响给分,从而得到该要素内各类别对结果的影响量; 最后系统进行复合,得出排序结果。以表示对结果影响的优劣程度,作为决策的依据。
8. 空间统计分析 其数学表达式为: Gp = WiCip 式中, Gp表示p点的最终复合结果值; Wi表示第i个要素的权重; Cip表示第i个要素在p点的类别的专家打分分值。
8.空间统计分析 专家打分模型实现 ①打分:用户首先在每个feature的属性表里增加一个数据项,填入专家赋给的相应的分值;
Arcmap中空间分析工具栏中的统计工具菜单
9、空间统计分类分析 分类评价中常用的数学方法 分类分析的方法: 主成分分析(Principal Component Analysis,PCA) 层次分析法 系统聚类分析 判别分析
9、空间统计分类分析 1、主成分分析法 概念 主成分分析是以取样点作为坐标轴,以变量作为矢量,通过相似系数建立相关矩阵,研究变量之间的亲疏关系。 方法 利用变量之间的相关矩阵,通过由用户确定的阈值,从数据库变量集合中选择一定数量的关键独立变量,以消除其他冗余变量。这种方法克服了变量选择时的冗余和相关,然后选择信息最丰富的少数因子进行各种聚类分析。
9、空间统计分类分析 计算方法 设有m个样本,n个变量,构造矩阵 其斜方差方阵只为对称矩阵
9、空间统计分类分析 用Jacobi方法找出线性变换 使得 y1 , y2,…,yn互不相关,R矩阵的特征值越大,该主成分的贡献越大,因而可以选择累计贡献百分比在一定阈值以内的若干因子作为主因子参加分析运算。
9、空间统计分类分析 2、层次分析法(AHP) 概念 在分析涉及大量相互关联、相互制约的复杂因素时,各因素对问题的分析有着不同程度的重要性,决定它们对目标的重要性序列对问题的分析十分重要。 AHP方法把相互关联的要素按隶属关系划分为若干层次,请有经验的专家们对各层次各因素的相对重要性给出定量指标,利用数学方法,综合众人意见给出各层次各要素的相对重要性权值,作为综合分析的基础。
9、空间统计分类分析 3、聚类分析 概念 变量聚类分析就是将一组数据点或变量,按照其在性质上亲疏远近的程度进行分类。 两个数据点在m维空间的相似性可以利用这些点在变量空间的距离来度量。一般距离采用欧氏距离或马氏距离。距离越小,表明两者的相似性越大。 应用 系统聚类是根据多种地学要素对地理实体进行划分,对不同的要素划分类别往往反映不同目标的等级序列,如土地分等定级、水土流失强度分级等。
9、空间统计分类分析 步骤: 3、聚类分析 系统聚类的步骤一般是根据实体间的相似程度,逐步合并若干类别,其相似程度由距离或者相似系数定义。 进行类别合并的准则是使得类间差异最大,而类内差异最小。
(b) 提取要素“2”的聚类结果 (a) 栅格数据系统样图 聚类分析示意图
9、空间统计分类分析 4、判别分析 概念 判别分析与聚类分析同属分类问题,所不同的是,判别分析是根据理论与实践,预先确定出等级序列的因子标准,再将分析的地理实体安排到序列的合理位置上。 常规的判别分析主要有距离判别法和Bayes最小风险判别法等。 应用 对于诸如水土流失评价、土地适宜性评价等有一定理论根据的分类系统的定级问题比较适用。
空间数据分析的一般过程 1.建立分析的目的和标准 2.准备空间操作的数据 3.进行空间分析操作 4.准备表格分析的数据 5.进行表格分析 6.结果的评价和解释 7.如有必要,改进分析 8.产生最终的结果图和表格报告
作业及思考题 何谓缓冲区?在GIS 中它有何作用? 2 下面两个多边形图层A和B,图中标注的是多边形的属性, 请画出A与B两个图层Overlay的结果图层C的示意图,并标 注属性,其中C的属性为C=A+B。 3 论述点、线、多边形数据之间的叠加分析的内容和方法