第二章 地理信息系统的数据结构 2006.1
第一节 地理空间及其表达 我国的三大坐标系 54北京坐标系(局部平差) 80国家大地坐标系(整体平差) 地心坐标系 高程基准 黄海平均海平面 1985国家高程基准 相差29mm
地理空间实体表达方式
地理信息系统的基本单元(实体)类型
拓扑:是一种确定空间特 征及其相互关系的数学方法。如弧段的长度、方向。多边形的面积、邻接性等
信息分类
信息分层
地图投影 统一的地理基础包括统一的地图投影系统﹑统一的地理网格坐标系统以及统一的地理编码系统。统一的地图投影系统就是要为地理信息系统选择和设计一种或几种适用的地图投影系统和网格坐标系统,为各种地理信息的输入输出以及匹配提供一个统一的定位框架,使各种来源的地理信息和数据能够具有共同的地理基础,并在这个基础上反映出它们的地理位置和地理关系特征。
地图投影的目的和方法
投影类型
按投影变形性质分类 (1)等角投影 (2)等积投影 (3)任意投影
标准网经纬线形状分类 地图投影标准网是指该类投影最简单的经纬线网形状。按标准网经纬线形状可将地图投影分为方位投影﹑圆柱投影﹑圆锥投影﹑伪圆柱投影﹑伪圆锥投影﹑多圆锥投影等。
常用的地图投影 加拿大CGIS图件比例尺与投影对应表 地图类型 比例尺 投影系统 地形图系列 1 :2.5万 1 :5万 1 :12.5万 地形图系列 1 :2.5万 1 :5万 1 :12.5万 1 :25万 1 :50万 1 :100万 UTM Lambert 地质图系列 土地利用图系列 植被图系列 土地能力图系列 自然资源图系列 加拿大CGIS图件比例尺与投影对应表
我国出版的地图中常用的投影 世界地图的投影有:等差分纬线多圆锥投影,正切差分纬线多圆锥投影(1976年方案),任意伪圆柱投影和正轴等角割圆柱投影。 半球地图的投影有: 东半球图: 横轴等面积方位投影和横轴等角方位投影。 西半球图: 横轴等面积方位投影和横轴等角方位投影。 南、北半球地图主要有正轴等距离方位投影、正轴等角方位投影、正轴等面积方位投影、斜轴等面积方位投影和彭纳投影标准纬线等。 亚洲地图的投影斜轴等面积方位投影,彭纳投影。 欧洲地图的投影有斜轴等面积方位投影和正轴等角圆锥投影。 北美洲地图的投影为斜轴等面积方位投影和彭纳投影。 南美洲地图的投影有斜轴等面积方位投影和桑逊投影。 澳洲的投影有斜轴等面积方位投影和正轴等角圆锥投影。 拉丁美洲地图的投影有斜轴等面积方位投影。
中国地图的投影有: 中国全图:斜轴等面积方位投影、斜轴等角方位投影、彭纳投影和伪方位投影。 中国全图(南海诸岛作插图)为正轴等面积割圆锥投影和正轴等角割圆锥投影。 中国分省(区)地图的投影主要有正轴等角割圆锥投影、正轴等面积割圆锥投影、正轴等角圆柱投影和高斯一克吕格投影(宽带)。 中国大比例尺地图的投影:多面体投影(北洋军阀时期)、等角割圆锥投影(Lambert)(解放前)和高斯一克吕格投影(中华人民共和国成立以后)。 通常讲,我国基本比例尺地形图(1:100万、1:50万、1:25万、1:10万、1:5万、1:2.5万、1:1万、1:5000)除1:100万外均采用高斯—克吕格投影为地理基础。1:100万采用Lambert投影其分幅原则与全球统一使用的百万分之一地图一致。
等角横切椭圆柱投影(高斯-克吕格投影) 所谓高斯-克吕格投影,又称高斯投影是等角横轴切椭圆柱投影。它是德国测量学家高斯于1825-1830年首先提出的。实际上,直到1912年,由德国另一位测量学家克吕格推导出实用的坐标投影公式后,这种投影得到推广,所以该投影又称高斯-克吕格投影。
高斯投影的特点 1. 与圆柱相切的子午线投影后为一直线,称为中央子午线;赤道投影后为一与中央子午线正交的直线;两者构成了高斯直角坐标系的纵﹑横坐标轴; 2. 中央子午线投影后长度不变。赤道投影后其长度距中央子午线愈远变形愈大; 3. 中央子午线东西两侧的点﹑线的投影以中央子午线为对称轴而对称。直线的投影也是距中央子午线愈远而长度变形愈大; 4. 除中央子午线和赤道外,其它经纬线的投影,都是成为向两极收敛的曲线。
通用横轴墨卡托投影公式 通用横墨卡托投影(UTM)与高斯—克吕格投影相比较,这两种投影之间仅存在着很少的差别,从几何意义看,UTM投影属于横轴等角割园柱投影,圆柱割地球于两条等高圈(对球体而言)上,投影后两条割线上没有变形,中央经线上长度比小于1(假定=0.9996)
地理信息系统中地图投影的配置原则 统一的坐标系是地理信息系统建立的基础。不论是什么样的地理信息系统,它们的投影坐标系统的配置具有以下的四个特点: (1)各个国家的地理信息系统所采用的投影系统与改国的基本地图系列所用的投影系统一致。 (2)各比例尺的地理信息系统中的投影系统与其相应比例尺的主要信息源地图所用的投影一致; (3)各地区的地理信息系统中的投影系统与其所在区域适用的投影系统一致。 (4)各种地理信息系统一般以一种或两、三种投影系统为其投影系统,以保证地理定位框架的统一。 地理信息系统中投影配置的一般原则是: (1)所配置的投影系统应与相应比例尺的国家基本图(基本比例尺地形图、基本省区或国家大地图集)的投影系统一致; (2)系统一般只考虑至多两种投影系统,一种服务于大比例尺的数据处理与输入输出,另一种服务于中小比例尺; (3)所用投影以等角为宜,但不绝对。 (4)所用投影应与网格坐标系统相适应,即采用的网格系统在投影坐标带中应保持完整。
第二节 地理空间数据及其特征
空间数据类型 来源不同分类 地图数据 影像数据 地形数据 属性数据 元数据 对象不同分类 类型数据 面域数据 网络数据 样本数据 曲面数据 文本数据 符号数据
地理信息系统的空间数据结构 内部数据结构基本上可分为两大类:即矢量结构和栅格结构。两类结构都可用来描述地理实体的点、线、面三种基本类型
矢量数据结构
栅格数据结构 实际应用中,每个网格通常会有不同的几种属性值,由于只能取一种,这就有不同的取值方法。 (1)中心点法。即用处于栅格中心点的地物类或现象特性决定栅格的值。有时也称为网格交点归属法。 (2)面积占优法,就是以占栅格最大的地物类或现象特征决定栅格单元的值。 (3)长度最占优法。当覆盖的网格过中心部位时,横线占据该格中的大部分长度的属性值定为栅格单元的值。 (4)重要性法。根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元的值。如重要性依次为C,A,E,B和D。
四叉树编码 把整个2nx2n像元组成的阵列当作树的根结点,树的高度为n级(最多为n级)。每个结点有分别代表西北、东北、西南、东南四个象限的四个分支。编码记录每个终点(或叶子结点)的地址和值,其中地址包括两个部分,共占32位(二进制),最右边四位记录叶节点的深度,它代表了该点所处四叉树的层数,地址由从根结点到该叶子结点的路径表示。从右边第五位起2n字节记录象限位置,其中0代表北西,1代表北东,2代表南西,3为南东,每层位置用两位二进制表示。数字图象中,第10行,第4列的结点深度为4,第一层位于SW象限为2,第二层位于NW象限为0,第三层位于NE象限为1,第四层位于SE象限为3。 00000000000000000000110100100100 转换为十进制3364,这样,记录了各个叶子结点的地址和值,就记录了整个图象。
四叉材编码法的优缺点 四叉材编码法的优点:①容易而有效地计算多边形的数量特征;②阵列各部分的分辨率是可变的,边界复杂部分四叉树较高即分级多,分辨率也高,而不需表示许多细节的部分则分级少,分辨率低,因而既可精确表示图形结构又可减少存贮量;③栅格到四叉树及四叉树到简单栅格结构的转换比其它压缩方法容易;④多边形中嵌套异类小多边形的表示较方便。 四叉树编码的最大缺点是转换的不定性,用同一形状和大小的多边形可能得出多种不同的四叉树结构,故不利于形状分析和模式识别。
栅格数据的组织方法
栅格数据内部编码方法(存储) 直接编码是最简单、最直接的编码方式 链码编码。又称为弗里曼编码 或边界码 游程长度编码 四叉树编码
矢量数据内部编码方法
X,Y坐标方法;树状索引编码法;拓扑结构编码等
地理信息系统的处理流程
一体化数据结构 规定 1。对于点状目标,只表示该点的位置及与节点关联的弧段信息 2。对于线状目标,用一组元子来填满整个路径,并表示该弧段的拓扑信息 3。对于面状目标,由元子填满路径的一组边界和由边界组成的紧凑空间。 一般用基本网格和细分网格表示,用两个Morton码表示
空间索引机制 空间索引就是指依据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。 空间索引介于空间操作算法和空间对象之间,它通过筛选作用,大量与特定空间操作无关的空间对象被排除,从而提高空间操作的速度和效率。空间索引的性能的优劣直接影响空间数据库和地理信息系统的整体性能,它是空间数据库和地理信息系统的一项关键技术
栅矢一体化空间数据结构一个重要的研究领域是如何建立有效的空间索引结构。目前对线要素索引结构研究较多,主要有PMR四叉树、带树和桶方法等,而面要素的索引结构主要有四叉树和R树等。
格网型空间索引 基本思想是将研究区域用横竖线条划分大小相等和不等的格网,记录每一个格网所包含的空间实体。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体,这样一来就大大地加速了空间索引的查询速度。
BSP树空间索引 BSP树是一种二叉树,它将空间逐级进行一分为二的划分(图)。BSP树能很好地与空间数据库中空间对象的分布情况相适应,但对一般情况而言,BSP树深度较大,对各种操作均有不利影响。
KDB树空间索引 优点:它对于多维空间中的点进行索引具有较好的动态特性,删除和增加空间点对象也可以很方便地实现; 缺点:不直接支持占据一定空间范围的地物要素,如二维空间中的线和面。该缺点可以通过空间映射或变换的方法部分地得到解决。 空间映射或变换就是将2n维空间中的区域变换到2n维空间中的点,这样便可利用点索引结构来对区域进行索引,原始空间的区域查询便转化为高维空间的点查询。 空间映射或变换方法仍然存在着缺点:高维空间的点查询要比原始空间的点查询困难得多;经过变换,原始空间中相邻的区域有可能在点空间中距离变得相当遥远,这些都将影响空间索引的性能。
R树和R+树 R树根据地物的最小外包矩形建立,可以直接对空间中占据一定范围的空间对象进行索引。 优点: R树可以较容易地进行插入和删除操作; 缺点:区域之间有重叠,空间索引可能要对多条路径进行搜索后才能得到最后的结果,因此,其空间搜索的效率较低。 在R+树中,空间区域没有重叠,而没有重叠的区域划分可以使空间索引搜索的速度大大提高;但由于在插入和删除空间对象时要保证兄弟结点对应的空间区域不重叠,而使插入和删除操作的效率降低。
CELL树 R树和R+在插入、删除和空间搜索效率两方面难于兼顾 在空间划分时不再采用矩形作为划分的基本单位,而是采用凸多边形来作为划分的基本单位,具体划分方法与BSP树有类似之处,子空间不再相互覆盖。CELL树的磁盘访问次数比R树和R+树少,由于磁盘访问次数是影响空间索引性能的关键指标,故CELL树是比较优秀的空间索引方法
栅格结构与矢量结构的比较