第3章(下) GIS空间数据结构 北京建筑工程学院 王文宇
授课目录 第一节 GIS数据结构基础 第二节 栅格数据结构 第三节 矢量数据结构 第四节 高级数据结构
第三节 矢量数据结构 概述 编码方案 代表GIS软件 矢量数据结构的特点
一 概述 矢量数据结构是另一种常见的图形数据结构,它是用一系列有序的x、y坐标对表示地理实体的空间位置 矢量结构的特点:属性隐含,定位明显 矢量型数据结构按其是否明确表示各地理实体的空间相互关系可分为实体型和拓扑型两大类。 实体型(简单的数据结构) 拓扑型(拓扑数据结构) 矢量数据结构通过记录空间对象的坐标及空间关系来表达空间对象的位置。
二 编码方案 实体式编码 索引式 双重独立编码 链状双重独立式
实体式编码 实体式数据结构是指构成多边形边界的各个线段,以多边形为单元进行组织。 Spaghetti models store only the coordinate data Spatial relationships between features is not recorded Finding two adjacent polygons would require reading in all the data and comparing the coordinates of all the polygons. Thus, spaghetti models are very inefficient for doing spatial analysis
实体式编码 点: ( x ,y ) 线: ( x1 , y1 ) , (x2 , y2 ) , … , ( xn , yn ) 独立编码 数据库 标识码 属性码 存储方法 点号 X Y 1 11 22 2 33 44 … n 55 66 点: 点号文件 点位字典 只记录空间对象的位置坐标和属性信息,不记录拓扑关系。又称面条结构。 存储: 独立存储:空间对象位置直接跟随空间对象; 点位字典:点坐标独立存储,线、面由点号组成 线: 点号串 面: 点号串 空间对象编码 唯一 连接几何和属性数据
实体型编码的利与弊 优点 结构简单、直观,编码容易 缺点 ①数据冗余,相邻多边形的公共边易产生分歧; ②实体互相独立,缺乏联系;
索引式 索引式数据结构是对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构。 树状索引结构消除了相邻多边形边界的数据冗余和不一致的问题,在简化过于复杂的边界线或合并多边形时可不必改造索引表,邻域信息和岛状信息可以通过对多边形文件的线索引处理得到。
双重独立编码 这种数据结构最早是由美国人口统计局研制来进行人口普查分析和制图的,简称为DIME(Dual lndependent Map Encoding)系统或双重独立式的地图编码法。它以城市街道为编码的主体。其特点是采用了拓扑编码结构。
DIME编码 双重独立式数据结构是对图上网状或面状要素的任何一条线段,用其两端的节点及相邻面域来予以定义。 线号 a O A 1 8 b 2 左多边形 右多边形 起点 终点 a O A 1 8 b 2 c B 3 d 4 e 5 f C 6 g 7 h i 9 …… 双重独立式数据结构是对图上网状或面状要素的任何一条线段,用其两端的节点及相邻面域来予以定义。
链状双重独立式 链状双重独立式数据结构是DIME数据结构的一种改进。在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线段合为一个弧段(或链段),每个弧段可以有许多中间点。 在链状双重独立数据结构中,主要有四个文件:多边形文件、弧段文件、弧段坐标文件、结点文件。
实体型与拓扑型数据结构比较 实体型虽然会产生数据冗余和歧异,但易于编辑。 拓扑型消除了数据的冗余和歧异,但操作复杂,甚至会产生新的数据冗余。
三 代表GIS软件 两者都是目前最常用的数据结构模型 实体型代表软件为MapInfo,Arcview 拓扑型代表软件为ARC/INFO
Arcview支持的矢量数据 Shape files Arc/Info coverages Can be directly viewed and used by Arcview Can convert from and to shape files TINs CAD drawings
shapefiles Uses the simple, compact spaghetti model Supports multipoint, multiline, and multishape features Polygons are stored as enclosed shapes boundaries of adjacent polys are repeated Topology must now be generated on-the-fly Uses spatial indexes to speed processing
ArcView Shapefile separate, countable exhaust the space? Discrete object view separate, countable exhaust the space? space between objects? editing a polygon boundary? No topology in shapefiles
ArcInfo Coverage
It is one of the primary vector data storage formats for ArcInfo. A coverage stores geographic features as primary features (such as arcs, nodes, polygons, and label points) and secondary features (such as tics, map extent, links, and annotation). Associated feature attribute tables describe and store attributes of the geographic features.
Shape vs Coverage Shapefile:一种基于文件方式存储GIS数据的文件格式。至少由.shp,.dbf,.shx三个文件作成,分别存储空间,属性和前两者的关系。是GIS中比较通用的一种数据格式。 Coverage:一种拓扑数据结构,数据结构复杂,属性缺省存储在Info表中。目前ArcGIS中仍然有一些分析操作只能基于这种数据格式进行操作。
四 矢量数据结构的特点 用离散的点描述空间对象与特征,定位明显,属性隐含 用拓扑关系描述空间对象之间的关系 四 矢量数据结构的特点 用离散的点描述空间对象与特征,定位明显,属性隐含 用拓扑关系描述空间对象之间的关系 面向目标操作,精度高,数据冗余度小 与遥感等图象数据难以结合 输出图形质量号,精度高
Choosing a data model Raster advantages Vector advantages Simple data model Efficient for data with high spatial variability Efficient for low spatial variability when compressed Vector advantages Can store data efficiently with high precision Gives much greater precision and accuracy
Raster is faster but Vector is correcter Choosing a data model Raster is faster but Vector is correcter
Choosing a model for analysis Operations best suited to raster analysis Overlays and arithmetic, boolean, and map algegra operations Buffering Viewshed analysis (what parts of a surface can be seen) Operations best suited to vector analysis Connectivity, network modeling Point-in-polygon and Line-in-polygon overlays
第四节 高级数据结构 高级数据结构
Regions or Multishape features Regions are made of one or more polygons Polygons may overlap or be separate Convenient for representing Hawaii (many islands, one state) Convenient for representing a process through time
Networks (route systems) Routes are composed of sections. Each section is a single arc, or piece of an arc. Allows different attributes to be stored along different sections of the same arcs Allows attributes to be defined using length measures (such as mileposts) instead of in x-y coordinates. Useful for utility, transportation, and hydrologic modeling and analysis
TINs Triangular interpolation networks composed of triangular facets representing a plane oriented in space TIN模型在概念上类似于多边形网络的矢量拓扑结构,只是TIN模型不需要定义“岛”和“洞”的拓扑关系。它不仅要存储每个点的高程,还要存储其平面坐标、节点连接的拓扑关系,三角形及邻接三角形等关系。 Uses of TINs Basis for deriving 3-D data from irregularly spaced data well depths --> depth to water table map Contouring Interpolation estimating values at intermediate locations
谢谢合作!