第五讲 地理信息系统的数据
程承旗
北京大学遥感与地理信息系统所
地理信息系统的数据
? 地理信息系统的一个重要部分就是数据 。
? 数据类型,在开发一个特定的 GIS时, 要根据应
用需求确定对各类数据的要求 。
? 数据获取,随着 GIS产业化的深入发展,越来越
多的数据资料被不同数据生产部门数字化
? 数据质量,数据质量是指数据适用于不同应用的
能力。
一、数据类型
确定 GIS数据需求
寻找数据源
大地测量控制
地籍测量
航空测量
遥感室外调查(土壤、植被、交通等)
定点观察(地球物理、气象、水文、生态等)
地形图
人口普查
工业 /经济调查
基础设施
(通讯、电力、运输、医疗、教育等)
有无所需的数据内容
空间数据的基本特征
? 空间数据描述的是现实世界各种现象的
三大基本特征:空间, 时间和专题属性 。
空间特征
? —— 空间特征指空间物体的位置、形状
和大小等几何特征,以及与相邻物体的
拓扑关系
? 人类对空间目标的定位一般不是通过记忆其空间坐标,
而是确定某一目标与其他更熟悉的目标间的空间位置
关系, 而这种关系往往也是拓扑关系 。
?
专题特征
? 专题特征指的是除了时间和空间特征以
外的空间现象的其他特征。
? 如地形的坡度、坡向、某地的年降雨量、土地酸碱度、
土地覆盖类型、人口密度、交通流量、空气污染程度

时间特征
? 空间数据总是在某一特定时间或时间段
内采集得到或计算产生的
数据的测量尺度
? 对特定现象的测量就是根据一定的标准对其赋
值或打分 。
? 命名式的测量尺度也称作类型测量尺度, 只对
特定现象进行标识, 赋予一定的数值或符号而
不定量描述 。
? 次序测量尺度是基于对现象进行排序来标识的 。
? 比例测量尺度的测量值指那些有真零值而且测
量单位的间隔是相等的数据
数据来源
? 数据来源可以大致分为原始数据或处理
加工后的数据, 又可将数据源分为非电
子数据和电子数据两类 。
数据种类
? 1,基础制图数据
? 基础制图数据包括地形数据和人文景观数据 。
? 1) 图形结构
? 2) 拓扑结构格式
? 2,自然资源数据
? 3,调查统计数据
? 4,数字高程数据
? 获取和存贮高程数据的方法有 4种基本方法:规则格网
法, 离散等高线法, 断面量测法和不规则三角网法 。
? 5,法律文档数据
? 6,已有系统数据
全球定位系统
? 全球定位系统
? 卫星如何测距?
? GPS接收机如何与卫星同步产生伪码?
? GPS的误差与微分纠正
? GPS系统,美国 NAVSTAR GPS
? TRANSIT
? 俄国 GLONASS
? 欧空局 GEOSTAR
R-=c
航空象片
? 航空摄影胶片的特性
? 航空摄影
? 垂直摄影象片的几何性质
? 立体象对上测量高度并建立地面坐标系
? 1) 航空象片相对定向, 建立航空象片坐标系
? 2) 测量象点视差计算象点高度
? 3) 建立地面坐标系
? 航空象片坐标向通用的地图投影坐标系的转换
? 正射影象
? 航测数字景象目前可以有两种方式获得:
? 一是用高精度扫描仪对航空象片扫描得到数字影象;二是用数字
摄影机直接得到数字影象
遥感数据
? 遥感数据有下列优点:
? 1) 增大了观测范围 。
? 2) 能够提供大范围的瞬间静态图象 。
? 3) 能够进行大面积重复性观测, 即使是人类
难以到达的偏远地区也能够做到这一点 。
? 4) 大大加宽了人眼所能观察的光谱范围 。
? 5) 空间详细程度高 。
遥感图象的空间分辩率
? 名义分辩率 =图象某行对应于地面的实际距离 /
该行的象元素
? 雷达是一种自身发射电磁能又回收这种能量的
主动式系统, 它又分为真实孔径雷达和合成孔
径雷达 。
? 雷达图象有两种分辩率:一种是由其发送信号
脉冲持续的时间和信号传播方向与地面的夹角
决定的,称为距离分辩率。另一种分辩率是由
雷达波束的宽度和地物离飞行底线的距离决定
的,而波束宽度又与雷达波长成正比,与天线
的长度成反比,这种分辩率被称为方位分辩率。
数据特点
? 扫描式传感器所获图象
? 侧视雷达图象
? 常的卫星数据
? 目前世界上常用的卫星数据仍是美国的陆地卫
星 ( Landsat) 专题制图仪 ( ThematicMapper,
TM), 诺阿气象卫星的甚高分辩率辐射仪
( NOAA-AVHRR) 和法国 SPOT卫星的较高分
辩 率 传 感 器 ( HRV ) 数 据 及 美 国 的
SPACEIMAGING的 IKNOS高分辨率卫星数据 。
地图
地图一般分为普通地图和专题地图 。
? 普通地图是一般性的参考图, 它主要用来表达六方面内容;居民
地, 道路, 行政边界, 地形, 及地表覆盖, 水系和典型目标物 。
? 常见的专题地图:
? 天气预测图 —— 以天气类型, 温度和降水空间分存为主的地图;
? 旅游图 —— 以介绍旅游景点位置和交通状况为主的地图;
? 交通图 —— 以介绍街区和公共交通状况为主的地图;
? 地铁线路图 —— 反映地铁站点位置, 路径, 中转位置等为主的地
图;
? 地势图 —— 以反映地形起伏和山脉高程为主的地图;
? 反映自然条件的专题地图有;地质图, 土壤图, 气候图, 植被图,
太阳能分布图, 风能分布图, 洋流图, 潮汐图等;
? 反映经济状况的专题图:交通图, 工业图, 农业图, 商业图, 贸
易图, 水利图, 电力图, 渔业图, 林业图, 牧业图等 。
地图符号
地图制作过程和地图综合
? 地图的制作与 GIS开发过程有许多相似之处, 大致可分
下列步骤:
? 1) 调查分析地图用户的要求;
? 2) 确定制图目标, 确定比例尺, 投影, 内容, 设计符号,
编制地图规范;
? 3) 收集数据, 野外测量, 象片判读, 问卷调查等;
? 4) 对数据进行鉴别, 分析处理;
? 5) 转绘数据到基础底图上;
? 6) 进行地图综合, 先选样区试验再对整个制图区域进行
综合;
? 7) 进行地图清绘;
? 8) 检查质量, 检验精度等;
? 9) 修改后制版印刷 。
地图制图工作要点
? 取舍;它实际上贯穿于整个制图过程中 。
? 分类;指的是将同样的或类似的制图对象划入一组 。
? 简化:实际上, 取舍, 分类和符号化都是为了简化细节, 但简化
还有其它形式 。
? 符号化:由于不可能将所有制图对象的实际形状按比例缩小到地
图上, 所以地图上要用符号 。 符号又分为两类:抽象符号或象形
符号 。
? 地图综合分为两部分;图形综合和制图内容综合 。
? 1) 图形综合
? 对点状, 线状, 面状符号的综合需要不同的方法 。
? 2) 内容综合
? 内容综合有两个方面:取舍和分类 。
TIGER文件
? 建立 TIGER系统原是为了达到以下目的:
? 1) 建立并维护一个覆盖美国所有领土的数字地理数据
基础;
? 2) 美国生产用于普查局查计和发表报告的地图;
? 3) 能够给由地理特征所构成的多边形为基础产生的普
查地段和地理区域赋予独立的地址 。
? TIGER文件的应用经历了三个阶段:产生, 更新, 应
用维护 。
? TIGER整合各种类型数据的基础是三种几何单元:零
维单元, 一维单元, 二维单元 。
? TopologicallyIntegratedGeographic EncodingReferencing
零维单元只代表地表线状特征的交点和端点, 而不是一般用于表达开头或
其它类型的点;一维单元只代表连接两个零维单元的线, 而不代表任何线
的形状;二维单元只代表一组相连的一维单元所构成的最小面积, 一组二
维单元可用来定义地理范围 。
二、数据获取
数据加工整理
? 一, 数据分类标准
? 二, 基础原始数据的确定
? 三, 原始数据项目的确定
? 四, 数据标准的准确性的确定
? 五, 数据录入表设计
数据采集
? 一, 空间图形数据的采集
二, 非空间属性数据的采集
三, 空间数据和非空间数据的连接
空间图形数据的采集
? 1,手扶跟踪数字化输入
? 1) 数字化过程
? 2) 数字化方式
? 数字化有两种基本方式:流方式和点方式 。
? 3) 数字化仪的其它输入功能
? 4) 矢量到栅格数据的转换
? 5) 数字化的精度
? 6) 数据共享
空间图形数据的采集
? 1,扫描数字化
? 1) 栅格扫描仪扫描
? 2) 栅格扫描数据到矢量的转换
? 3) 矢量扫描仪扫描
? 4) 其它类型的自动数字化仪器
? ① 视频数字化仪
? ② 解析测图仪
? 5) 已是数字形式的空间数据的输入
? 6) 其它数字形式的空间数据源
? ① 内插数据
? ② 其它数据
数字化设备
数字化设备种类
? 手扶跟踪数字化仪 ( 数字化仪 )
? 扫描数字化仪 ( 扫描仪 )
数字化仪,又称图数转换器,是一种
通过一定量测手段将图形或图像转换成
数字信息的装置。常用的数字化设备有:
手扶跟踪数字化仪
?简称数字化仪, 是一种用来
记录和跟踪地图点, 线位置
的手工数字化设备 。
数字化仪的幅面
? 根据尺寸和使用条件的不同, 大
致可分为两类:
小型数字化仪 (Tablet):
A4,A3,A2;
大型数字化仪 (Digitizer):
A1,A0,A00。
数字化仪的构成
? 感应板 (Drawing Board)
? 标识器 (Pointing Device)
数字化仪的性能参数
? 操作方式
? 输出格式
? 数据转换率
? 分辨率
? 精度
操作方式
? 点方式
? 流方式 (开关流 /连续流 )
? 增量方式 (距离 /时间 )
? …,..
扫描数字化仪
? 简称扫描仪, 它是一
种将地图或图像按一定的
分辨率一般转换成栅格格
式数据的装置 。
扫描仪的种类
? 按辐射分辨率划分:
二值扫描仪、灰度扫描仪和彩色扫描仪;
? 按结构划分:
滚筒扫描仪, 平台扫描仪和 CCD摄像机
? 按扫描方式划分:
栅格扫描仪, 矢量扫描仪
扫描仪的构成
? 滚筒 /平台
? 扫描头
? 光学系统
? 光电转换系统
( CCD单元将光信号转换为模拟电信号 )
? 模数转换器
( A/D转换器将模拟电信号变为数字电信号 )
扫描仪的主要性能指标
? 光学分辨率
? 最大分辨率
? 辐射分辨率(色彩位数)
? 扫描幅面
? 接口方式
光学分辨率
? 是指扫描仪的光学系统可以采集的实
际信息量,也就是扫描仪的感光元
件 —— CCD的分辨率。
例如 A4扫描仪可扫描的最大宽度为 216mm( 8.5
英寸),它的 CCD含有 5100个单元,其光学分辨率
为 5100点 /8.5英寸 =600dpi。
最大分辨率
? 又叫内插分辨率,它是在相邻像素
之间求出颜色或者灰度的平均值从
而增加像素数的办法。内插算法增
加了像素数,但不能增添真正的图
像细节,因此,我们应更重视光学
分辨率。
辐射分辨率
? 又叫色彩分辨率,或色彩深度、色
彩模式、色彩位或色阶,总之都是
表示扫描仪分辨彩色或灰度细腻程
度的指标,它的单位是 bit(位)。
色彩位确切的含义是用多少个位来
表示扫描得到的一个像素。
接口方式
? 又称连接界面,是指扫描仪与计算
机之间采用的接口类型。常用的有
USB接口,SCSI接口和并行打印机接
口。 SCSI接口的传输速度最快,而
采用并行打印机接口则更简便。
扫描数据处理
? 二值化:将彩色或灰度扫描数据的像元用
1位即用 0和 1表示 。
? 细化:将扫描图中的线划减细为分辨单元
宽的线划 。
? 矢量化:将栅格数据转换为矢量数据 。
? 断线修复:由于扫描质量的影响或删除了
某些符号造成一些矢量线不连续, 连接断
线即为断线修复 。
扫描数据处理 (续)
? 要素提取:选择需要的要素, 剔
除不需要的要素和噪声 。
? 符号识别:提取出符号的特征 。
? 属性赋值:对矢量化的要素赋予
属性特征值 。
交互式地图扫描数字化
? 也称屏幕数字化, 由人工参
与从扫描数据中提取矢量信
息并赋予属性值 。
扫描仪在制图中的利与弊
? 数字化速度快,人为误差小;
? 扫描数据量大, 增加存储负担;
? 后续处理比较复杂和费时;
? 对扫描原图质量要求高 。
三、数据质量
数据质量
?
? 数据质量是指数据适用于不同应用的能力 。
数据质量的基本特点
? 1) 准确度 ( Accuracy),即测量值与真值之间的接近程度, 可用
误差来衡量 。
? 2) 精度 ( Precision),即对现象描述的详细程度 。
? 3) 不确定性 ( Uncertainty),指某现象不能精确测得, 当真值不
可测或无法知道时, 我们就无法确定误差, 因而用不确定性取代
误差 。
? 4) 相容性 ( Compatibility),指两个来源的数据在同一个应用中
使用的难易程度 。
? 5) 一致性 ( Consistency),指对同一现象或同类现象的表达一致
程度 。
? 6) 完整性 ( Completeness),指具有同一准确度和精度的数据在
类型上和特定空间范围内是否完整的程度 。
? 7) 可得性 ( Accessibility),指获取或使用数据的容易程度 。
? 8) 现势性 ( Timeliness),指数据反映客观现象目前状况的程度 。
一、空间数据质量的内容
? 1,微观部分
? 1) 定位精度
? 2) 属性精度
? 3) 逻辑一致性
? 4) 分解力
? 2,宏观部分
? 1) 完整性
? 2) 时间性
? 3) 数据档案
? 4) 适用性
数据的误差类型
? 数据误差
? ● 地形图的位置误差;
? ● 地形图的属性误差;
? ● 时域误差;
? ● 逻辑不一致性误差;
? ● 不完整性误差;
?
数据的误差类型
? 数据转换和处理的误差:
? ● 数字化误差;
? ● 格式转换误差;
? ● 不同 GIS系统间数据转换误差;
数据的误差类型
? 应用分析时的误差:
? ● 数据层叠加时的冗余多边形;
? ● 数据应用时, 由应用模型引进的误差 。
? 这些误差分类对于了解误差分布特点, 误差和处
理方法, 产生误差的特点有很多好处 。
常见的 误差原因
? 1) 空间数据不完整主要因为数字化不完整 。
? 2) 空间位置误差可能是较小的位移, 也可能是较大的粗差 。
? 3) 空间数据的比例尺错误和误差大多是在数字化时用了错误的比
例因子引起的 。
? 4) 空间数据的变形误差来源有原数字化材料上的各种变形误差 。
? 5) 空间与非空间数据的连接错误通常是在数字化时给空间实体输
入了错误的识别符 。
? 6) 在非空间数据本来完整无缺的情况下, 数据库中发生数据不全
的现象主要是键盘输入错误和漏输数据;数字化前的准备工作中
编码不完全或编码错误等 。
二、数据的检核和存贮
? 一, 一般检查
? 二, 误差检核
? 三, 橡皮板变换和弯曲
? 四, 数据检核
? 五, 数据编辑
? 1,修改各类差错
? 2,数据更新
? 六, 数据存贮
?
?
几何误差的检测和表达
? 1) 点误差
? 2) 线误差
属性误差
? 1) 确定抽样方法
? ● 系统抽样;等间距布点;
? ● 随机抽样;对整个区域随机布点;
? ● 分区抽样;按一定的样点个数在划分的每个区域随
机布点;
? ● 系统分区随机抽样:对整个区域内等面积分区, 并
在区内随机布点 。
? 2) 确定抽样数
? 1) 使用其他方法确定每个样本的属性做为参考数据
? 2) 建立误差矩阵
计算各种精确定度或误差的方法
下面列出几个常用指标;
? 总准确度:对角线样点数之和除以总样点数;
? 生产者准确度;每个属性值的正确样点数除以该属性
值总的验证样点数 ( 列合计 ) ;
? 使用者准确度:每个属性值的正确样点数除以该属性
值的总数 ( 行合计 ) ;
? 错判误码差 ( Commissionj Error), 1-使用者准确度;
? 遗漏误差 ( Omission Error) ; 1-生产者准确度;
属性数据的不确定性