第四章 空间数据采集与数据处理 1.数据源种类 2.空间数据采集的任务 2.1数据采集任务 2.2数据采集方法 2.3矢量数据采集 2.3.1 地图跟踪数字化 2.3.2 地图扫描矢量化 2.4属性数据采集 3.空间数据处理
1.数据源种类 数据源指建立GIS的地理数据库以及进行应用分析所需的各种数据的来源。 空间信息的获取是一个空间信息系统建设的首要任务。一个空间信息系统建设,70%以上的工作(费用)将花费在空间信息(特别是矢量数据)的获取上面。
1.数据源种类 对于一个GIS应用系统的建设来说,空间数据(图形数据)的来源主要有四种渠道: 数据转换:各种交换格式数据(DXF/E00 /MIF等 遥感/GPS数据:图象、GPS坐标点文件等 数字测量:形成纸质地图或坐标点文件 已有纸质地图:地图数字化 统计数据:GIS重要的属性数据源 文本资料:行业部门的有关法律文档、行业规范等。
1.数据源种类 数据转换是目前空间数据共享的一个重要途径,因此,一般的空间信息系统平台都提供了各种交换格式的数据转入/转出功能。 纸质地图是GIS主要的数据源。主要通过对地图的跟踪数字化和扫描数字化获取。在使用地图时,应考虑到地图投影所引起的变形,必要时需要进行坐标转换或投影变换。 遥感影像含有丰富的资源环境信息,是大面积、动态的、实时的数据源,是GIS数据更新的重要方式。将坐标点文件转为地图数据也是空间信息系统平台必须提供的基本功能。
2.空间数据采集的任务 2.1采集任务:将地理实体的几何数据和属性数据输入到地理数据库中,就是GIS的数据采集。
2.空间数据采集的任务 2.2 主要采集方法 已存在于其它系统的几何数据,经过转换装载 测量仪器获得地几何数据,传输进入数据库 2.2 主要采集方法 已存在于其它系统的几何数据,经过转换装载 测量仪器获得地几何数据,传输进入数据库 遥感影像提取专题信息,需要进行几何纠正、光谱纠正、影像增强、图像变换、结构信息提取等,属于遥感图像处理内容 栅格数据的获取,通过扫描仪输入,大多可直接进入GIS 矢量数据采集
2.3矢量数据的采集 矢量(图形)输入要解决的问题:即几何数据与属性数据。拓扑数据一般在已有的几何数据基础上生成。一般需要进行三方面的工作,即几何数据的采集、属性数据的采集、几何数据与属性数据的连接。
矢量化处理流程
2.3矢量数据的采集 两种方式 地图跟踪数字化(数字化仪输入、屏幕矢量化)——传统的数据采集方法。 地图扫描矢量化(自动或半自动矢量化):较为先进的地图数字化方式
2.3.1地图跟踪数字化 数字化仪原理 目前较为常用的数字化仪是电磁感应式数字化仪,它是利用电磁感应原理检测出图形坐标数据的。由游标线圈(定位器)、工作桌面(包括铺设其下的栅格阵列导线)以及电子部件、微处理器和输出装置组成。其中游标线圈是电磁发射源,工作桌面接收信号,电子部件、微处理器把游标线圈在工作桌面上的位移量转换成x,y坐标,最后经输出装置输入计算机
2.3.1地图跟踪数字化 基本过程 将需要数字化的图件(地图、航片等)固定在数字化板上,设定数字化范围,输入有关参数,选择数字化方式,按地图要素的类别实施数字化 在进行地图手扶跟踪数字化时, 需要在数字化仪面板坐 标和地图真实坐标之间 建立映射关系,通常的 做法是先录入三个不在 同一条直线上的控制点。
控制点(tic)概念 地图上具有控制地图图幅精确度的一些点,也称地理控制点(同名点),通常这些点都具有准确的实地坐标或可以精确定位的,如图幅图廓点、公路网格点、测量点、道路交叉口等
软件数字化技术路线:参看资料,通过实验掌握
2.3.2 地图扫描数字化 1、扫描仪数字化思想 2、主要方法 通过扫描将地图转换为栅格数据,然后采用栅格数据矢量化的技术追踪出线和面,采用模式识别技术识别出点和注记,并根据地图内容和地图符号的关系自动给矢量数据赋以属性值。 2、主要方法 自动矢量化 交互式矢量化 :采用人机交互方式
地图扫描数字化(自动矢量化) 1、灰度二值化 灰度二值化是将一幅有各种灰度(亮度)分布的黑白图像变为非黑即白(非“1”即“0”) 的二值图像,是将图像变为图形的一种过渡。 二值化阈值确定方法:经验法、直方图、人机交互法和数理统计法。
地图扫描数字化(自动矢量化) 2、线条细化 剥离法:其实质是从数字图像上,由上而下,自左到右一次选3× 3个像元,进行分析,以不影响其连通性为原则决定中心像元是否可以剥离,逐次排下去,可以将线条带剥离成单个像元的细线。(如图只有2、3、4、5、10、11、12、16、22、23、28、33、34、35、38、42、43、46、50可以将中心点剥去)
地图扫描数字化(自动矢量化) 3、跟踪,生成矢量格式坐标链 自动搜索方法 ●搜索结点—— 3 × 3网格法 ●结点间8个方向跟踪组成网格链,逐个网格取其中心点坐标,转换成矢量坐标链弧段 点 端点 中间点 结点
2.4属性数据的采集 2.4.1属性数据(统计数据或专题数据)的采集 数据量较小,可以在输入几何数据的同时,用键盘输入; 数据量大,与几何数据分别输入,根据预先建立属性表输入属性; 从其它统计数据库导入属性,通过关键字段联接图形。 2.4.2几何数据与属性数据之间的联系:公共标识码(用户ID),即 几何数据(图形数据)与属性数据之间的公共标识符
2.5 栅格数据常用的获取方法 2.5.1 遥感数据 2.5.2手工方式:可在专题地图上均匀地划分网格,每一单位格子覆盖部分的属性数据成为各点的值,形成栅格地图文件; 2.5.3 矢量数据转换:数字化仪跟踪,得到矢量数据,再转为栅格数据; 2.5.4 图片扫描数据 :扫描数字化方法,逐步扫描专题地图,将扫描数据重新采样和再编码得到栅格数据文件。
3.空间数据处理 采集之后的数据处理工作包括:几何纠正、图形和文本数据的编辑、图幅的拼接、拓扑关系的生成等,即完成GIS的空间数据在装入GIS的地理数据库前的各种工作。 3.1矢量数据拓扑关系的自动建立 3.2图形编辑 3.3空间数据的坐标变换 3.4图幅拼接 3.5数据格式转换,包括矢量栅格数据转换,不同软件数据格式的转换,不同介质之间的数据转换
3.1矢量数据拓扑关系的自动建立 3.1.1链(弧段)的组织 3.1.2结点编辑 3.1.3建立多边形 3.1.4确定左右多边形 实现的基本步骤包括: 找出坐标链的相交点 自动切成新的坐标链(弧段) 把弧段按照一定的顺序存储,如按照最大或最小的x或y坐标的顺序,以便检索 把弧段按照顺序编号 3.1.1链(弧段)的组织 3.1.2结点编辑 3.1.3建立多边形 3.1.4确定左右多边形 3.1.5图形编辑
3.2 图形编辑 空间数据编辑的必要性 修正数据输入错误 维护数据的完整性和一致性 更新地理信息 空间数据编辑内容 数据不完整、重复 空间数据位置不正确 空间数据比例尺不准确 空间数据变形 几何和属性连接有误 属性数据不完整
3.2 图形编辑 纠正数据采集错误的重要手段,以及图形更新的必要步骤,如对点、线、面的增加、删除、修改等。 首先是点、线、面的捕捉 再进行拓扑编辑(局部或全部拓扑) 多边形连接编辑 弧段和结点连接编辑 思考:删除一个弧段影响两个还是多个多边形的拓扑结构属性?
3.2 图形编辑 3.2.1 图斑合并:指两相邻的图斑合并,即系统将相邻的两图斑共用弧段删除,用户给出合并后的图斑编码,在软件支持下实现两图斑的合并 3.2.2 图斑分裂:图斑合并的逆操作 课后练习:试写出图斑合并过程的算法
3.2 图形编辑 3.2.3图斑定积分裂: 指在指定图斑内或边界上的某部位,寻找一点,将该点与图斑边界线的两点(在地籍图中就是两界址点)连线,分裂出一个小区域,要求该校区域内面积为定值。这是房地产出售中经常遇到的实际问题。
GIS的数据处理——拓扑编辑小结 拓扑编辑 (1)建立或生成拓扑关系:找交点生成结点和弧段 装配多边形 建立多边形标签(label) 建立多边形(弧段)属性表 (2)数据纠错(净化处理):清除假结点和多余的中间点 (3)拓扑编辑:按拓扑数据的要求(比如修改后的数据重新建拓扑)进一步编辑
3.3 空间数据的坐标变换 3.3.1 概念:空间数据从一种数学状态到另一种数学状态的变换,实质是建立两个平面点之间(或球面坐标和平面坐标)的一一对应关系,是空间数据处理的基本内容之一。主要包括数字化仪坐标和扫描影像坐标与地理坐标的变换,以及两个不同投影的坐标变换 3.3.2 空间数据需要进行坐标转换的原因(地理意义) 3.3.3 坐标变换的主要内容 几何纠正 投影变换
坐标变换原因
3.3.2坐标变换的地理意义 指将地球球面上的地理对象表示在平面上的数学基础(如投影方式、比例尺、方向等)。对地图进行数字化时必须将这种数学法则反映到数字地图中 (1)实现地图的数学法则 (2)实现由设备坐标(数字化仪坐标或栅格图像坐标)到现实世界坐标(实际地理坐标)的转换 由数字化设备读取的坐标值直接依赖于该设备的坐标系统及其设置,并不代表实际地理坐标,因此有必要建立坐标转换公式,在数字化过程中将设备坐标转换为实际地理坐标。
3.3.2 坐标变换的地理意义 (3)控制数据采集的精度 由控制点建立的坐标转换公式实际上是一组回归方程,通过在图面上均匀选取适当数目的控制点,并精确输入控制点的实际地理坐标,可以提高回归方程的拟和精度,进一步控制数字化的精度。
控制点建立的坐标转换 电子地图 数字化仪面板 纸质地图 控制点 X地图 = X面板 * a1 + Y面板 * b1 + c1 Y地图 = X面板 * a2 + Y面板 * b2 + c2 X面板1, Y面板1 X面板2, Y面板2 X面板3, Y面板3 X地图1, Y地图1 X地图2, Y地图2 X地图3, Y地图3 将上面三组数据代入此方程组,就可以求得: a1 b1 c1 a1 b1 c1 这六个参数。
3.3.2坐标变换的地理意义 (4)实现多图幅拼接或不同比例尺间地图的匹配 当需要对多幅地图进行数字化时,如果在多幅地图之间或在不同比例尺之间建立了一个统一的坐标系,并在每一幅地图都输入一定数量的控制点及相应的地理坐标,则经由控制点拟合的坐标变换公式,将所有图幅的数字化仪平面坐标转换为所建立的坐标系中的坐标,使得图幅拼接或不同比例尺间地图的匹配成为可能。
3.3.3 坐标变换的主要内容 将地图上各点的原坐标,转换成新的坐标。可分为两类:一是将非地理坐标转换为地理坐标(地理坐标化georeferencing);二是校正或配准(registration,几何纠正),可在任意两个坐标系中进行,不一定非要转为地理坐标。 3.3.3.1几何纠正 (1)主要应用:扫描地形图、遥感影像,进行图纸变形误差的纠正,建立实际地理坐标系。 (2)采用方法: 仿射变换:使用最多的一种几何纠正方式 相似变换 二次变换
(2)主要方法 公式: (2.1)仿射变换 特性:只考虑x和y方向上的变形 直线变换后仍为直线 平行线变换后仍为平行线 不同方向上的长度比发生变化
基本坐标变换示意 (a)平移 (b)缩放 (c)图形旋转
(2.2)坐标变换中待定系数的确定——地面控制点(或同名点)是求解转换的基础 (2)主要方法 (2.2)坐标变换中待定系数的确定——地面控制点(或同名点)是求解转换的基础 要实现仿射变换,需要知道不在同一直线上的3对控制点的数字化坐标及其理论值,才能求得上述6个待定参数。实际中通常利用4个点(控制点)。
(2.2)坐标变换中待定系数的确定 计算方法:数值变换法,这种方法主要用于地图的数字化。最小二乘法是最为常用的数值变换法。 利用最小二乘法的基本思想是,先用一组线性多项式拟合坐标变换公式,实际上是建立回归曲线(转换曲线),用该曲线进行原坐标系的所有点的坐标变换。控制点是转换基础。 在地图上选取若干控制点,获取控制点的数字化仪坐标和实际地理坐标,然后利用这组坐标值,根据最小二乘法原理算出多项式的系数。这样在地图数字化过程中,就可以利用这组多项式计算出任意一点的地理坐标。 一般的GIS软件都提供了坐标变换功能。
(2)主要方法 (2.3)相似变换与二次变换 相似变换与仿射变换(affine)的区别 The SIMILARITY transformation scales, rotates, and translates the data. It will not independently scale the axes, nor will it introduce any skew. A similarity transformation requires a minimum of two control points. 二次变换适用于原图有非线性变换的情况
控制点数目的选取需注意的问题 一般来讲,线性关系采用四个或更多的TIC点提高纠正精度; 非线性转换中,转换多项式的次数与控制点数目可以用公式: k=(n+1)(n+2)/2 其中n为多项式的次数,k为最少控制点数目 多项式转换关系并非次数越高越好,实践中一般先取一次多项式,用足够多的控制点拟和、观察、分析,有必要再“升级”; 常用的分析方法,是计算每一个控制点相对于回归线的偏离,用均方根表示: 均方根= 如果某点的均方根特别大,说明该点有问题,去掉不用;若较多的点有问题,可以考虑升级。
3.3.3.2 投影变换 (1)目的:当系统所使用的数据来自不同地图投影时,需要将一种投影的几何数据(x,y)转成所需投影的数据(X,Y)。实质是建立两个平面点之间的一一对应关系。 公式:X=f1(x,y),Y=f2(x,y)
3.3.3.2 投影变换 正解变换:x=fx(L,B) y=fy(L,B) 反解变换:L=FL(x,y) B=FB(x,y) (2)解算这种法则有几种方法 解析法,已知坐标变换公式(如各种投影类型),直接利用变换公式进行计算。分为正解变换与反解变换:地理经纬度与X、Y坐标变换。 GIS中图形的缩放、平移、旋转及三唯变换等操作中都使用这种变换。 数值变换法:如果不易求出两投影之间坐标的直接关系,可以采用多项式逼近的方法,一般选择10个以上的同名点。
3.4 图幅拼接 3.4.1为什么需要图幅拼接? 3.4.2图幅拼接步骤 数字化过程经常把一幅图分成几部分数字化 标准的地形图是分幅的 逻辑一致性的操作(属性的一致) 识别与检索相邻图幅 相邻图幅边界点坐标数据的匹配(两条线段的衔接)。 相同属性多边形公共边界的删除
图形拼接 (a)拼接前; (b)拼接中的边缘不匹配; (c)调整后的拼接结果 图幅拼接
3.5矢量数据与栅格数据的相互转换 涉及复杂的数值运算;转换后的误差存在 3.5.1 矢量到栅格的转换 设dx、dy分别为栅格单元在x和y方向上的边长,xmin、ymin、xmax、ymax表示图形的边界范围,M、N表示转换后的行列数,则有如下关系: M=|ymax - ymin |/dy N=|xmax - xmin |/dx
3.5.1矢量到栅格的转换:点、线、面转换 (1)点 (2)线 设点的矢量坐标为(x,y),转换后栅格单元的行列值分别为I和J,则 I=1+INT((ymax-y)/dy) J=1+INT((x–xmin)/dx) (2)线 线实体由一系列坐标对表示,在变为栅格结构时,除把序列中坐标对变为栅格行列坐标以外,还需要按照栅格精度要求,在坐标点之间插满一系列栅格点,可以用栅格中心扫描线与直线段求交后进行点转换获得行列号。(详细参看相关资料)
多种方法(内部点扩散法、射线法、扫描法、复数积分法和边界代数法等) 3.5.1矢量到栅格的转换:点、线、面转换 (3)多边形 多种方法(内部点扩散法、射线法、扫描法、复数积分法和边界代数法等) 边界代数法基本思想: 对每幅图的全部具有左右多边形编号的边界弧段,沿其前进的方向逐个搜索,当边界上行时,将边界线位置与左图框之间的网格点加上一个值=(左多边形号)-(右多边形号);当边界线下行时,将边界线位置与左图框之间的网格点加上一个值=(右多边形号)-(左多边形号),而不管边界线的排列顺序。
边界代数法 优点 不需要逐点搜寻判别边界,而是根据边界的拓扑关系,通过简单的加减代数运算将拓扑信息动态地赋予各栅格点,实现矢量格式到栅格格式的转换。算法简单,可靠性好;每条边界仅算一次,免去公共边界的重复运算;又不考虑边界存放的顺序,因此,速度快。
Arcinfo中的转换命令
3.5.2栅格格式到矢量格式的转换 3.5.2.1 目的 将栅格数据分析结果,通过矢量绘图装置输出 为了压缩数据,将大量面状栅格数据转换为少量数据表示的多边形的边界 将扫描仪获取的栅格数据加入矢量形式的数据库
3.5.2栅格格式到矢量格式的转换 3.5.2.2 实质:提取以相同编号的栅格数据集合表示的多边形区域的边界和边界的拓扑关系,并表示成多个小直线段的矢量格式的过程。 步骤: 多边形边界提取 边界线追踪 拓扑关系生成 去除冗余结点 灰度二值化 线条细化 跟踪,生成矢量格式坐标链
GIS中主要的数据处理内容小结 1、拓扑编辑 2、属性与图形的交互编辑 这种编辑基于空间对象的唯一标识符,保持空间位置数据和属性数据二者编辑修改的同步性和一致性。 3、图幅接边 4、制图概括(制图综合) 5、地理坐标变换与地图投影变换 6、空间数据内插 7、矢量与栅格数据转换
思考题 屏幕矢量化的主要步骤包括哪些? 简要说明通过扫描仪自动矢量化得到矢量地图数据的原理与过程 空间数据源都有哪些?各种来源的数据源是如何准确匹配在一起的? 在坐标转换中,选择控制点数量及分布的判断标准;在数字化过程中提高数据采集精度的方法有哪些? 如果有两个小组自数字化得到两张相邻图幅的地图数据不能准确拼接,可能会有哪些原因?如何解决? 空间数据采集与处理过程的会产生哪些类型的误差?如何解决