前言 最近几年来,地理信息系统无论是在理论上还是应用上都处在一个飞速发展的阶段。 GIS 被应用于多个领域的建模和决策支持,如城市管理、区划、环境整治等等,地理信息成 为信息时代重要的组成部分之一;“数字地球”概念的提出,更进一步推动了作为其技术支 撑的 GIS 的发展。与此同时,一些学者致力于相关的理论研究,如空间感知、空间数据误 差、空间关系的形式化等等。这恰好说明了地理信息系统作为应用技术和学科的两个方面, 并且这两个方面构成了相互促进的发展过程。 从应用的角度看,近几年 GIS 的发展主要体现在以下几个方面: 1:应用领域的扩大,如一些商业部门开始利用 GIS 进行客户研究;此外同遥感、 GPS 的结合,为 GIS 开拓了更加广泛的应用空间,如汽车导航,环境监测等。 2:大量成熟的商业 GIS 平台出现,或已有的软件不断推出新的产品。 3:空间数据的建设越来越受到重视,基于空间数据基础设施的建设,开始了空间数据 共享和互操作的研究。 在这样的背景下,全国许多高校的地理系都开始了 GIS 专业人才的培养,以满足 GIS 发展的需求。北京大学城市与环境学系于 1999 年开始招收 GIS 专业本科生,这样,编写一 本全面的、能够反映 GIS 最新进展的教材就成为当务之急。所以,作者编写这本书。 在编写的过程中,考虑到 GIS 专业学生今后从事的工作可能包括以下几类: 1:GIS 理论的研究工作; 2:GIS 软件的开发; 3:GIS 项目组织管理; 4:应用 GIS 的其它领域。 因此,在设计本书的结构时兼顾了这些方面,依次介绍了 GIS 的基本理论、功能实现、 应用技术。本书共二十一章,分为五部分: 1:第一章,介绍了 GIS 的相关概念,信息、数据、信息系统,以及 GIS 的发展历史和 展望; 2:第二——五章,介绍了 GIS 的空间数据模型、参照系统和 GIS 中的数据,这几章组 成了 GIS 的理论基础; 3:第六——十一章,按照从空间数据录入、管理、分析、表现的过程讲述了 GIS 的基 本功能; 4:第十二——十九章,介绍了 GIS 应用技术的各个方面。 5:附录(两章),分别介绍了 GIS 的计算机基础和国内外的 GIS 工具软件,供阅读本 书时参考。 在编写中,每章前面的导读概括了本章的内容,说明了与其它章节的关系;正文中采用 灰底文字讲述了相关的知识,供阅读时参考。 本书作为教材而编写,但同时希望它能够对 GIS 开发人员、管理人员有所帮助。 本书由邬伦、刘瑜确定整体结构,主要编写人员有刘瑜、张晶、马修军、韦中亚、田原 等。各章主笔分工为:第一——五章,第七章,第十一章:张晶;第八、九、十章:马修军; 第六章和附录一:韦中亚;第十二章——第十九章,附录二:刘瑜。最终本书由刘瑜、邬伦 统稿,邬伦定稿。 本书的完成,是北京大学城市与环境学系 GIS 教研室的多年工作的结晶,教研室人员 的工作,包括 Citystar 软件的开发以及相关的科研工作,都为本书提供了极好的“原料”。 教研室中,下列人员参加了书稿的讨论以及部分文字整理工作:叶燕林,张金海,刘岳峰, 林报嘉,唐大仕,高勇,张毅,王永乾,周贵云,苏元峰,刘玉玲,赵建伟,刘述,赵伟。 本书的完成,得到了许多老师和同行的关怀和支持。德高望重的陈述彭院士于百忙之中 为本书作序;何建邦教授、承继成教授、谢昆青博士、任伏虎博士、张世琨博士为本书提出 了许多有益的建议和修改意见;山西大学马义娟,江西省气象局曹华盖、文海龙也参加了部 分工作,在此表示衷心的感谢。 地理信息系统一门实用性很强的学科,必须更多地动手实践,才能更好地理解其中的一 些概念,因此与本书配套,作者还将继续编写地理信息系统实习教材,并开发相应的实习软 件。 由于作者水平和时间所限,书中错误在所难免,希望读者不吝指正。 作者 2000/9/1 序 国务院学位委员会决定:新生的地理信息系统与古老的地图学并列为理科专业。在科学 出版社新版的《北京大学地理教学丛书》中,邬伦教授等主编的《地理信息系统——原理、 方法和应用》 又列为其中系列教材之一,同时也作为大学本科、研究生及自学考研的参考书。 它的出版,标志着地理信息系统作为大学理科专业已经到了科技界、教育界的认同——它既 是应用领域广泛的工程技术;又是跨越信息科学、地球科学和空间科学的应用基础科学。这 是科教兴国战略与教育深化改革的又一崭新的亮点。我感到非常欣慰,并表示热烈的祝贺! 随着全球化、网络化和知识经济蓬勃发展的新世纪的到来,我国地理信息系统正迅猛地 由实验室走向产业化和社会化。由设备引进、技术克隆迈上自主开发、数据挖掘与知识创新 的新台阶。随着加入世界贸易组织( WTO),在互联网服务领域(ISP )、信息服务领域(ICP )、 以在用服务领域( ASP),都需要大量地理信息系统(GIS )人才,特别是管理科学结合的管 理地理信息系统(MGIS )人才。 我国地理信息系统起步稍晚。20 世纪末,互联网的普及还远远低于世界平均水平。计 算机软、硬件人员在信息产业中所占比例低于 15%。虽然已有 74%的重点企业建立了网站 主页,但大部分还没有建立防火墙设施,安全审计、监测和自动恢复系统。在国家重点企业 中,采用的服务器惠普、 IBM 各占 35%以上, UPS 山特独占 69%,路由器 CISCO 占 70%以 上,交换机 3COM 占 42%,操作系统 WINDOW 占 51%,办公软件 OFFICE 占 83.3%(据 国家经贸委经济信息中心调查)。在迎接全球化、网络化新机遇的同时,我国信息化所面临 的挑战也是十分严峻的,任重而道远,关键在于素质教育与科技人才的培养。我国联想生产 的 PC 机占有国内市场的 55%,北京大学的方正系统、Citystar 系统和其他院校开发的软件 已享有盛誉,其中地理信息系统中自主开发的软件已占有国内市场 25%左右,是非常良好 的开端,但在发达国家中,信息产业对国民经济增长贡献率和就业动力所占社会劳动力都已 超过 50%,我们的成就还只能算是万里长征的第一步。 近年出版了一系列地理信息系统教材,其中有些侧重于科学原理阐明,有些侧重于专业 部门的应用。邬伦博士以其深厚的地学造诣与计算机软件开发的丰富实践,融汇贯通化为一 体,又着眼于公共课程的广大性与大学本科的基础性,旁征博引,求实创新,图文并茂,深 入浅出,推出这部迎接新世纪空间时代和信息社会的好教材,是非常难能可贵的。我是非常 乐意向读者们郑重推荐的。 陈述彭 2000 年 10 月 12 日 《地理信息系统原理、方法和应用》书稿评审意见 关于地理信息系统的书籍、至少已经出版了数十本之多,但是由北京大学邬伦教授最近 编写的《地理信息系统原理、方法和应用》书稿具有与众不同的特点,读完之后,使人有新 鲜的感觉,该书的主要优点是:不仅正确而又精练地介绍了地理信息系统的基本内容,而且 又把本学科的最新概念,最新成果和动态趋势作了全面、系统的介绍,如从现实世界到比特 世界(第二章) , 35 集成技术(第十二章),网络地理信息系统(第十三章),地理信息系统 应用项目组织和管理(第十五章),地理信息系统软件工程技术(第十六章),地理信息系统 标准(第十七章),地理信息系统和社会(第十八章), 地球信息科学与数字地球(第十七章) , 地理信息系统和社会(第十八章) ,地球信息科学与数字地球(第十九章)和 GIS 的计算基 础(第二十章)等,不仅是必要的,而且也是合适的。 本书的另一个特点是它的结构合理,逻辑性强,文笔通顺,图文并茂,深入浅出,可读 性好。 该书不仅适合作大专院校的教材以及补充读物,也适合给工程技术人员,科研工作者和 其他专业人员作为参考书用,是一本很好的介绍地理信息系统的著作。 建议及早将它出版,与广大读者见面,估计定能受到欢迎好评。 北京大学遥感与 GIS 研究所教授、博导 国际欧亚科学院院士 承继成 2000 年 9 月 24 日 概论 1. GIS的定义,GIS是什么或者不是什么 2. 数据、信息、信息系统 3. GIS的发展历史 4. GIS功能概述(A Overview) 5. GIS和其他学科的关系 g108g32概述 g108g32AM/FM g108g32LIS 6. GIS发展展望 空间信息和空间数据 1. 现实世界到比特世界 2. 空间数据模型 g108g32要素模型 g108g32场模型 g108g32网络结构 g108g32时间 g108g32三维 3. 空间参照系 g108g32空间参照系 g108g32地图投影 4. GIS中的数据 g108g32数据类型 g108g32数据涵义 g108g32数据质量 g108g32元数据 GIS的功能 1. 计算机基础 g108g32硬件 g108g32数据库 g108g32算法和数据结构 g108g32面向对象技术 2. 空间数据获取 g108g32数字化 g108g32数据规范处理 3. 空间数据管理 g108g32栅格数据 g108g32矢量数据 g108g32矢量-栅格转换 g108g32空间索引技术 g108g32空间查询和检索 4. 空间分析 g108g32空间关系检测 g108g32空间度量 g108g32空间切分 g108g32网络分析 g108g32Buffer g108g32Overlay 5. 空间分析(二) g108g32实例 g108g32资源配置模型 g108g32知识挖掘 g108g32决策支持模型 g108g32时间序列模型 6. DEM g108g32DEM和DTM g108g32插值 g108g32DEM应用 7. 空间数据表现 g108g32符号 g108g32专题信息表现 g108g32地图设计 g108g32空间信息可视化 g108g32制图综合 GIS应用(Applications) 1. GIS应用举例 g108g32城市规划 g108g32城镇管理 g108g32电力 g108g32交通 g108g32环境 g108g32农业 g108g32林业 g108g32地质地貌 g108g32气象 2. GIS平台介绍 g108g32ARC/INFO g108g32MapInfo g108g32Intergraph g108g32国产GIS 3. 3S集成 g108g32RS介绍 g108g32GPS介绍 g108g323S集成应用 4. GIS项目以及项目组织 g108g32GIS项目类型(按照目的,规模进行分类) g108g32资金 g108g32人员 g108g32数据 g108g32进度控制 5. GIS软件工程 g108g32基础软件开发 g108g32应用系统开发 g108g32质量控制质量标准 6. 网络GIS g108g32计算机网络技术 g108g32分布式空间数据管理 g108g32WebGIS 7. GIS的标准化 8. GIS与社会 g108g32走出学院的GIS g108g32社会对GIS发展的影响 g108g32GIS与社会,另外几个问题 教育 产业 版权 9. 数字地球 如果说地图是地理学的第二代语言,那么地理信息系统就是地理学的第三代语言。 陈述彭 简单的说,地理信息系统是回答如下问题的信息系统——“哪里”。 Henry Tom 第一章 地理信息系统概论 导读:本章介绍了地理信息系统的一些最基本的、但又是非常重要的概念,包括信息、数据、信 息系统、空间数据、空间信息和地理信息系统。有些概念,如空间信息和空间数据,还将得到进 一步的阐述,实际上,空间数据也是本书中描述GIS功能的核心。 GIS既是一项技术,也是一门学科,本章也介绍了它的主要研究内容以及与其它学科,如地理学、 地图学、遥感等的关系。 本章同时介绍了GIS的组成、分类、功能、发展历史和展望,这些将在后面的章节中更为详尽地 被描述。 1.地理信息系统的基本概念 1. 1 信息、数据、地理数据与地理信息 1. 1. 1 信息(Information) 1)信息的含义 信息是近代科学的一个专门术语,已广泛地应用于社会各个领域。狭义信息论将信息定义为“两次不 定性之差”,即指人们获得信息前后对事物认识的差别;广义信息论认为,信息是指主体(人、生物或机 器)与外部客体(环境、其他人、生物或机器)之间相互联系的一种形式,是主体和客体之间的一切有用 的消息或知识,是表征事物特征的一种普遍形式。本书采用的定义为:信息是向人们或机器提供关于现实 世界新的事实的知识,是数据、消息中所包含的意义,它不随载体物理设备形式的改变而改变。 2)信息的特点 信息具有以下特点: g108g32 客观性:任何信息都是与客观事实紧密相关的,这是信息正确性和精确度的保证; g108g32 实用性:信息对决策是十分重要的,信息系统将地理空间的巨大数据流收集、组织和管理起来, 经过处理、转换和分析变为对生产、管理和决策具有重要意义的有用信息; g108g32 传输性:信息可以在信息发送者和接受者之间传输,既包括系统把有用信息送至终端设备(包括 远程终端)和以一定的形式或格式提供给有关用户,也包括信息在系统内各个子系统之间的流转和交换, 如网络传输技术; g108g32 共享性:信息与实物不同,信息可以传输给多个用户,为多个用户共享,而其本身并无损失。信 息的这些特点,使信息成为当代社会发展的一项重要资源。 1. 1. 2 数据 数据是指某一目标定性、定量描述的原始资料,包括数字、文字、符号、图形、图像以及它们能转换 成的数 据等 形式 。 数 据是 用以载 荷信 息的 物理 符号 , 数 据 本 身 并 没 有 意 义 。 如数字 “ 1” 。 信 息可 以离 开信 息系统 而独 立存 在, 也可 以离开 信息 系统 的各 个组 成和阶 段而 独立 存在 ; 而 数据的 格式 往往 与计 算机 系统 有关,并随载荷它的物理设备的形式而改变。 信息与 数据 是不 可分 离的 。 信 息由 与物 理介质 有关 的数据 表达 , 数据中 所包 含的意 义就 是信 息。 数 据 是记录 下来 的某 种可 以识 别的符 号, 具有 多种 多样 的形式 ,也 可以 由一 种数 据形式 转换 为其 他数 据形 式 , 但 其 中 包 含 的 信 息 的 内 容 不 会 改变。 数据 是信 息的载 体, 但并 不就 是信 息。 只 有 理 解 了 数 据 的 含义, 对 数 据 做 出 解 释 , 才 能提 取数据 中 所 包 含 的 信息。对数据 进 行 处 理 (运 算、排序、编码 、 分 类、增强 等) 就 是 为了得 到数 据中 包含 的信 息。 虽然 日常 生活中 数据 和信息 概念 分得 不是 很清 , 但 它们 有着 不同的 含义 。 可 以把数 据比 作原 材料 , 而 信息是 对原 材料 处理 的结 果。 如同 一个 木匠 , 在 一 些工具 的帮 助下 , 可 以 把 木 材 做成有 用的 家具 。 同 样 , 计算机 专业 人员 应用 计算 机的硬 件和 软件 把原 始数 据转换 成信 息 。 这种 转换 过程 可用图 1-1 说明。 图 1-1:数据和信息 数据包 含原 始事 实, 信息 是把数 据处 理成 有意 义的 和有用 的形 式 。 例如 , 每 个学生 所得 分数 对教 师来 说是原 始数 据 , 而把 这些 数据进 行汇 总并 计算 每班 平均得 分 , 教 师根据 平均 分判断 班级 总体 情况 , 这 些 结 果对教 师来 说就 是信 息。 与数据 相比 , 信 息具 有以 下特征 : 数 据是 原始 事实 , 信 息 是 数 据 处 理 的 结 果 ; 对 一 个 人 是 信 息 对 其 他 人 可 能 是 数据; 信息 必须 是有意 义 或 有 用的; 使用 的信息 必 须 是 完整、 精确、 相关 和 及时的。 人的知识、经验作用到数据上,可以得到信息,而获得信息量的多少,与人的知识水平有关 * 。 1. 1. 3 地理信息和地理数据 地理数 据 是指 表征 地理 圈 或地理 环境 固有 要素 或物 质的数 量 、 质 量 、 分 布 特 征 、 联 系 和 规 律的数 字、 文字、 图像 和图 形等 的总 称。 地 理 信 息 是 有 关 地 理 实体的 性质 、 特 征和 运动 状态的 表征 和一 切有 用的 知识, 它是对 地理 数据 的解 释。 在地理 信息 中 , 其位 置是 通过数 据进 行标 识的 , 这 是地理 信息 区别 于其 它类 型 信 息的最显著的标志。地理信息具有区域性、多维结构特性和动态变化的特性: 1)区域性是通过经纬网等建立的地理坐标来实现空间位置的标识; 2)多维结构特性即在二维空间的基础上实现多专题的第三维结构; * 以上述的制作桌子的例子说明,同样的木材(数据) ,由于使用工具不同和制作者水平的高低,制作的桌子(信息)也不 同。 3) 地 理信 息的 时序 特征 十 分明显 , 可 以按 时间 尺度 将地理 信息 划分 为超 短期 的 ( 如 台 风 、 地 震 ) 、短 期 的(如江 河洪水、 秋季低 温) 、 中期的( 如土地利用 、作物估 产) 、 长期的(如 城市化、 水土流失 ) 、超 长期的(如地壳变动、气候变化)等。 地理数 据是 各种 地理 特征 和现象 间关 系的 符号 化表 示,包 括空 间位 置、 属性 特征及 时态 特征 三部 分 。 空间位 置数 据描 述地 物所 在位置 , 这 种 位置既 可以 根据大 地参 照系 定义 , 如 大地经 纬度 坐标 , 也 可以 定 义 为地物 间的 相对 位置 关系 , 如 空 间上的 距离、 邻接 、 重叠、 包含 等; 属 性 数 据又称 为非 空间 数据, 是 属 于 一定地 物 、 描 述 其 特 征 的 定性或 定量 指标 , 即 描 述 了信息 的非 空间 组成 部分 , 包 括语 义与 统计 数据 等 ; 时 态特征 是指 地理 数据 采集 或地理 现象 发生 的时 刻或 时段, 时态 数据 对环 境模 拟分析 非常 重要 , 越 来越 受到 地理信 息系 统学 界的 重视 。 从 地理 实体 到地理 数据 、 从 地理 数据 到地理 信息 的发展 , 反 映 了人类 认识 的 一 个巨大飞跃。 1. 2 信息系统( Information System)及其类型 系统( System) 是具有特定功能的、相互有机联系的许多要素所构成的一个整体。对计算机而言, 系 统是为 实现 某些 特定 的功 能, 由必 要的 人、 机器 、 方法或 程序 按一 定的 相关 关系联 系起 来进 行工 作的 集合 体, 内 部 要 素 之 间 的 相 互 联系通 过信 息流 实现 。 系 统的特 征由 构成 系统 的要 素及其 相互 之间 的联 系方 式所 决定。 1. 2. 1 信息系统 信息系 统是 具有 数据 采集 、 管 理、 分析 和表 达数 据 能力的 系统 , 它能够 为单 一的或 有组 织的 决策 过程 提供有 用的 信息 。 在 计算 机时代 , 信 息 系统都 部分 或全部 由计 算机 系统 支持 , 人 们常 常使 用计算 机收 集 数 据并将 数据 处理 成信 息 , 计算机 的使 用导 致了 一场 信息革 命 , 目 前 , 计 算 机 已经渗 透到 各个 领域 。 一 个基 于计算机的信息系统包括计算机硬件、软件、数据和用户四大要素。 1)计算 机硬件 包括各 类计算 机处理 及终端设 备,它帮 助人们 在非常短 的时间内 处理大 量数据、 存储 信息和快速获得帮助; 2)软件 是支持 数据信 息的采 集、存 储加工、 再现和回 答用户 问题的计 算机程序 系统, 它接受有 效数 据,并正确地处理数据;在一定的时间内提供适用的、正确的信息;并存储信息为将来所用; 3)数据是系统分析与处理的对象,构成系统的应用基础; 4)用户 是信息 系统所 服务的 对象。 由于信息 系统并不 是完全 自动化的 ,在系统 中总是 包含一些 人的 复杂因素,人的作用是输入数据、使用信息和操作信息系统,建立信息系统也需要人的参与。 在基于计算机的信息系统中,处理过程的作用是告诉人们各部分间的相互关系(图 1-2) 。 图 1-2:信息系统的组成 1. 2. 2 信息系统的类型 信息的 需要 完全 取决 于管 理的层 次, 设计 一个 系统 要满足 组织 中所 有层 次人 员的信 息需 要, 这种 系统 是很复 杂的 , 因为组 织中 使用的 信息 在数 量、 状态 和类型 上都 是易 变和 不可 预知的 。 在 组 织中将 信息 系 统 分成三 个管 理层 次: 操作 层(底 层) 、战 术层 (中 间 层)和 战略 层( 顶层 ) 。 操 作层包 括的 人员 如会 计师 、 销售人 员和 商店 监理 , 他 们执行 日常 工作 和上 级管 理所做 的计 划; 战术 层包 括组织 中的 高级 管理 人员 和参 与最高 管理 的中 层管 理人 员; 而管 理层 负责决 定组 织的发 展方 向 。 为了 解决 系统复 杂性 这一 问题 , 大 多 数 组织建立不同类型的系统来满足他们的需要,见信息系统类型图(图 1-3) : 分析模 型 专家系 统决策支 持系 统 外部信 息 附加事 实 规则 事务处 理 系 统 管理信息系 统内部信 息 图 1-3:信息系统的类型 1)事物处理 系统( Transaction Process System , TPS) 主要 用以 支持 操作 层 人员的 日常 活动 。它 主 要负责处理日常事务。 2) 管理信息 系统 ( Management Information System , MIS) 需要 包含 组织 中 的事务 处理 系统 , 并 提 供了内 部综 合形 式的 数据 , 以 及 外 部 组 织 的 一 般 范 围和大 范围 的数 据。 许多 战术层 提供 的信 息能 按照 该层 管理者 希望 的那 样以 熟悉 的和喜 欢的 形式 提供 。 但 是, 为 战 术 层 管 理 者 提 供 的另外 一部 分信 息和 大多 数为 战略层 管理 者提 供的 信息 是不可 能事 先确 定的 。 这 些不确 定性 对管 理信 息系 统的设 计者 来说 是个 很大 的挑 战。 3)决策支持 系统( Decision Support System , DSS) 能从 管理 信息 系统 中获 得信息 ,帮 助管 理者 制 定好的 决策 。 该系统 是一 组处理 数据 和进 行推 测的 分析程 序 , 用 以支持 管理 者制定 决策 。 它是基 于计 算 机 的交互 式的 信息 系统 , 由 分析决 策模 型 、 管理 信息 系统中 的信 息 、 决策 者的 推测三 者相 组合 达到 好的 决 策 效果。 4)人工智能 和专家 系统 专家系 统( Expert System ,ES)是 能模 仿人 工决 策处理 过 程 的 基 于 计 算 机 的 信息系 统。 专家 系统 扩大 了计算 机的 应用 范围 , 使 其从传 统的 资料 处理 领域 发展到 智能 推理 上来 。 MIS 能 提供信 息帮 助制 定决 策 , DSS 能帮 助改 善决 策的 质量, 只有 专家 系统 能应 用智能 推 理 制 作 决 策 并 解 释 决 策 理由。专家系统由五个部分组成:知识库、推理机、解释系统、用户接口和知识获得系统。 2.地理信息系统及其类型 2. 1 地理信息系统 地理信 息系 统 ( Geographical Information System, GIS) 是 一 种决策 支持 系统, 它具有 信息 系统 的各 种 特点。 地理 信息 系统 与其 他信息 系统 的主 要区 别在 于其存 储和 处理 的信 息是 经过地 理编 码的 , 地 理位 置及 与该位置有关的地物属性信息成为信息检索的重要部分。在地理信息系统中,现实世界被表达成一系列的 地理要素和地理现象,这些地理特征至少由空间位置参考信息和非位置信息两个组成部分。 地理信息系统的定义是由两个部分组成的。一方面,地理信息系统是一门学科 * ,是描述、存储、分析 和输出空间信息的理论和方法的一门新兴的交叉学科;另一方面,地理信息系统是一个技术系统,是以地 理空间数据库( Geospatial Database)为基础,采用地理模型分析方法,适时提供多种空间的和动态的地理 信息,为地理研究和地理决策服务的计算机技术系统。 地理信息系统具有以下三个方面的特征: 第一,具有采集、管理、分析和输出多种地理信息的能力,具有空间性和动态性; 第二, 由计算机系统支持进行空间地理数据管理, 并由计算机程序模拟常规的或专门的地理分析方法, 作用于空间数据,产生有用信息,完成人类难以完成的任务; 第三,计算机系统的支持是地理信息系统的重要特征,因而使得地理信息系统能以快速、精确、综合 地对复杂的地理系统进行空间定位和过程动态分析。 地理信息系统的外观,表现为计算机软硬件系统;其内涵却是由计算机程序和地理数据组织而成的地 理空间信息模型。当具有一定地学知识的用户使用地理信息系统时,他所面对的数据不再是毫无意义的, 而是把客观世界抽象为模型化的空间数据,用户可以按应用的目的观测这个现实世界模型的各个方面的内 容,取得自然过程的分析和预测的信息,用于管理和决策,这就是地理信息系统的意义。一个逻辑缩小的、 高度信息化的地理系统,从视觉、计量和逻辑上对地理系统在功能方面进行模拟,信息的流动以及信息流 动的结果,完全由计算机程序的运行和数据的变换来仿真。地理学家可以在地理信息系统支持下提取地理 系统各不同侧面、不同层次的空间和时间特征,也可以快速地模拟自然过程的演变或思维过程的结果,取 得地理预测或“实验”的结果,选择优化方案,用于管理与决策。 地理信息系统和 4M 对于地理学家、城市规划人员、资源管理者等使用地理信息的人们而言,他们观察并量测( Measure) 环境参数,并制作地图( Map)描述了地球的特征;他们监测( Monitor)周围环境的变化,对影响环境的 过程和活动建立模型(Model )。这四项活动(4M ),通过应用 GIS 技术,都可以得到改善和提高。 2. 2 地理信息系统的类型 地理信息系统按其内容可以分为三大类: 1)专题地理信息系统(Thematic GIS ) ,是具有有限目标和专业特点的地理信息系统,为特定的专门 目的服务。例如,森林动态监测信息系统、水资源管理信息系统、矿业资源信息系统、农作物估产信息系 统、草场资源管理信息系统、水土流失信息系统等。 2)区域信息系统(Regional GIS ) ,主要以区域综合研究和全面的信息服务为目标,可以有不同的规 模,如国家级的、地区或省级的、市级和县级等为各不同级别行政区服务的区域信息系统;也可以按自然 分区或流域为单位的区域信息系统。区域信息系统如加拿大国家信息系统、中国黄河流域信息系统等。许 多实际的地理信息系统是介于上述二者之间的区域性专题信息系统,如北京市水土流失信息系统、海南岛 土地评价信息系统、河南省冬小麦估产信息系统等。 3)地理信息系统工具或地理信息系统外壳( GIS Tools) ,是一组具有图形图像数字化、存储管理、查 询检索、分析运算和多种输出等地理信息系统基本功能的软件包。它们或者是专门设计研制的,或者在完 成了实用地理信息系统后抽取掉具体区域或专题的地理系空间数据后得到的,具有对计算机硬件适应性 强、数据管理和操作效率高、功能强且具有普遍性的实用性信息系统,也可以用作 GIS 教学软件。 在通用的地理信息系统工具支持下建立区域或专题地理信息系统,不仅可以节省软件开发的人力、物 力、财力,缩短系统建立周期,提高系统技术水平,而且使地理信息系统技术易于推广,并使广大地学工 作者可以将更多的精力投入高层次的应用模型开发上。 * 在“地球信息系统和数字地球”一章中提到的“地理信息科学”更加强调学科特性,与之对应,GIS 则作为应用技术。 2. 3 地理信息系统的构成 与普通 的信 息系 统类 似, 一个完 整 的 GIS 主 要 由 四 个部分 构成 , 即 计算 机硬 件系统 、 计 算机 软件 系统 、 地 理数据( 或空间数 据)和 系统管理 操作人员 。其核 心部分是 计算机系 统(软 件和硬件 ) ,空 间数据 反映 GIS 的地理内容,而管理人员和用户则决定系统的工作方式和信息表示方式。系统构成如图 1-4 所示。 图 1-4:地理信息系统的构成 2. 3. 1 计算机硬件系统 计算机 硬件 系统 是计 算机 系统中 的实 际物 理装 置的 总称, 可以 是电 子的 、 电 的、 磁 的 、 机 械 的 、 光 的 元件或装置, 是 GIS的物理外壳。系统的 规模、精度、速度、功能 、形式、使用方法甚至软 件都与硬件有 极大的关系, 受硬件指标的支持或制约 。 GIS由于其任务的复杂性 和特殊性,必须由计算机 设备支持。构 成计算 机硬 件系 统的 基本 组件包 括输 入 /输出 设备 、 中 央 处 理 单元、 存储 器 ( 包 括 主 存 储器、 辅助 存储器 硬 件 * ) 等 , 这 些 硬 件 组 件 协 同工作 , 向 计算 机系 统提 供必要 的信 息, 使其 完成 任务; 保存 数据 以备 现在 或将 来使用 ; 将 处 理 得 到 的 结 果或信 息提 供给 用户 。 图 1-5 表示了常 见的 实现 输入 输出功 能的 计算 机外 部设 备。 * 通常又称为内存和外存。 GIS 专 用外设 设备 计算 机 屏幕 键盘 鼠标器 标 准的计 算机外 围设备 网络 数字化仪 解析测图仪 遥感图像 处理系统 测绘仪器扫描仪 硬盘 磁带机 打印机 绘图仪 图 1-5:计算机标准外设和 GIS 使用的外设 3. 3. 2 计算机软件系统 计算机软件系统是指必需的各种程序。对于 GIS 应用而言,通常包括: 1)计算机系统软件 由计算 机厂 家提 供的 、 为 用户使 用计 算机 提供 方便 的程序 系统 , 通 常 包 括 操 作系统 、 汇 编 程 序 、 编译 程序、诊断程序、库程序以及各种维护使用手册、程序说明等,是 GIS 日常工作所必需的。 2)地理信息系统软件和其他支持软件 包 括 通用的 GIS 软件 包, 也可以 包括 数据 库管 理系 统、 计算机 图形 软件 包、 计 算机图 像处 理系 统、 CAD 等,用于支持对空间数据输入、存储、转换、输出和与用户接口。 GIS 软件包功能结构见图 1-6。 3)应用分析程序 是系统 开发 人员 或用 户根 据地理 专题 或区 域分 析模 型编制 的用 于某 种特 定应 用任务 的程 序 , 是 系 统 功 能的扩 充与 延伸 。 在 GIS 工具支 持下 , 应 用程 序的 开发应 是透 明的 和动 态的 , 与 系 统 的 物 理 存 储 结 构 无关, 而随着 系统 应用 水平 的提 高不断 优化 和扩 充 。 应 用 程 序作用 于地 理专 题或 区域 数据 , 构成 GIS 的具 体内 容, 这是用 户最 为关 心的 真正 用于地 理分 析的 部分 , 也 是从空 间数 据中 提取 地理 信息的 关键 。 用 户进 行系 统开 发的大部分工作是开发应用程序,而应用程序的水平在很大程度上决定系统的应用性优劣和成败。 用户接 口 数据输 出与 表示 数据输 入与 校验 应用分 析程 序 空间分 析函 数转 换 数据存 储管 理 图 1-6:地理信息系统软件的功能框架 2. 3. 3 系统开发、管理和使用人员 人是 GIS 中的 重要 构成 因 素 , GIS 不 同 于 一 幅 地图, 而是 一个 动态 的地 理模型 。 仅 有系 统软 硬件 和数 据还不 能构 成完 整的 地理 信息系 统, 需要 人进 行系 统组织 、 管 理、 维护 和数 据更新 、 系 统扩 充完 善、 应用 程序开 发 , 并 灵 活 采 用 地 理分析 模型 提取 多种 信息 , 为 研究 和决 策服 务 。 对 于合格 的系 统设 计 、 运 行 和 使 用来说 , 地 理 信息系 统专 业人员 是地 理信 息系 统应 用的关 键 , 而 强有力 的组 织是系 统运 行的 保障 。 一 个 周 密规划 的地 理信 息系 统项 目应包 括负 责系 统设 计和 执行的 项目 经理 、 信 息管 理的技 术人 员、 系统 用户 化的 应用工程师以及最终运行系统的用户。 2. 3. 4 空间数据 * 是指以 地球 表面 空间 位置 为参照 的自 然、 社会 和人 文经济 景观 数据 , 可 以是 图形、 图像 、 文 字、 表 格 和数字 等。 它是 由系 统的 建立者 通过 数字 化仪 、扫 描仪、 键盘 、磁 带机 或其 他系统 通讯 输 入 GIS,是系 统 程序作 用的 对象 , 是 GIS 所表达 的现 实世 界经 过模 型抽象 的实 质性 内容 。 在 GIS 中, 空间 数据 主要 包 括 : 1)某个已知坐标系中的位置 即几何 坐标 , 标 识地 理景 观在自 然界 或包 含某 个区 域的地 图中 的空 间位 置, 如经纬 度、 平面 直角 坐标、 极坐标等,采用数字化仪输入时通常采用数字化仪直角坐标或屏幕直角坐标。 2)实体间的空间关系 实体间的空间关系通常包 括:度量关系,如两个地 物之间的距离远近;延伸 关系(或方位关系) ,定 义了两 个地 物之 间的 方位 ;拓扑 关系 ,定 义了 地物 之间连 通、 邻接 等关 系, 是 GIS 分析 中最 基本 的关系 , 其中包 括了 网络 结点 与网 络线之 间的 枢纽 关系 ( 图 1-7-a) , 边界线 与面 实体 间 的构成 关系 (图 1-7-b) ,面 实体与岛或内部点的包含关系(图 1-7-c)等。 图 1-7:几种典型的拓扑关系 3)与几何位置无关的属性 即通常 所说 的非 几何 属性 或简称 属性 , 是 与地 理实 体相联 系的 地理 变量 或地 理意义 。 属 性分 为定 性和 定量的 两种, 前者 包括 名 称 、 类 型、 特 性等, 后者 包括数 量和 等级; 定性 描 述的属 性如 土壤 种类、 行 政 区 划等, 定量 的属 性如 面积 、 长 度 、 土 地 等 级 、 人 口 数量等 。 非 几何 属性 一般 是经过 抽象 的概 念, 通过 分类、 命名、 量算 、 统 计得 到。 任何地 理实 体至 少有 一个 属性, 而地 理信 息系 统的 分析、 检索 和表 示主 要是 通过 属性的操作运算实现的,因此,属性的分类系统、量算指标对系统的功能有较大的影响。 对地理信息系统的三种观点 [Maguire,1991] 对于 GIS 的定 义, 有 三 种 观点, 即地 图、 数 据 库 与 空间分 析的 观点 。 地 图观 点的定 义侧 重于 制图 有关 的内容 , 因 此 GIS 被 视 为 一个地 图分 析与 处理 系统 ; 数 据库 观点 的 GIS 定义 则侧重 于数 据库 设计 与实 现的 完美性 , 一 个 复 杂 的 数 据 库管理 系统 被视 为 GIS 不 可分割 的一 部分 ; 持 空 间 分析观 点的 定义 侧重 于分 析和 * 在下文中,将不再区分“地理数据”和“空间数据” ,它们都作为同一概念。 建模,GIS 被视为一门空间信息科学而不仅是一门技术。 3.地理信息系统的功能概述 地理信息系统的核心问题可归纳为五个方面的内容:位置、条件、变化趋势、模式和模型。 1)位置(Locations) 即在某个特定的位置有什么。 首先,必须定义某个物体或地区信息的具体位置,常用的定义方法有:通过各种交互手段确定位置, 或者直接输入一个坐标;其次,指定了目标或区域的位置后,可以获得预期的结果以及其所有或部分特性, 例如当前地块所有者、地址、土地利用情况、估价等。 2)条件(Conditions) 即什么地方有满足某些条件的东西。 首先,可以用下列方式指定一组条件,如从预定义的可选项中进行选取;填写逻辑表达式;在终端上 交互地填写表格。 其次,指定条件后,可以获得满足指定条件的所有对象的列表,如在屏幕上以高亮度显示满足指定条 件的所有特征,例如,其所位于的土地类型为居民区、估价低于 200,000 美元、有四个卧室而且是木制的 的房屋。 3)变化趋势(Trends ) 该类问题需要综合现有数据,以识别已经发生了或正在发生变化的地理现象。 首先,确定趋势,当然趋势的确定并不能保证每次都正确,一旦掌握了一个特定的数据集,要确定趋 势可能要依赖假设条件、个人推测、观测现象或证据报道等。 其次,针对该趋势,可通过对数据的分析,对该趋势加以确认或否定。地理信息系统可使用户快速获 得定量数据以及说明该趋势的附图等。例如,通过 GIS,可以识别该趋势的特性:有多少柑桔地块转作它 用?现在作为何用?某一区域中有多少发生了这种变化?这种变化可回溯多少年?哪个时间段能最好反 映该趋势?1 年、5 年还是 10 年?变化率是增加了还是减少了? 4)模式(Patterns ) 该类问题是分析与已经发生或正在发生事件有关的因素。地理信息系统将现有数据组合在一起,能更 好地说明正在发生什么,找出发生事件与哪些数据有关。 首先,确定模式,模式的确定通常需要长期的观察、熟悉现有数据、了解数据间的潜在关系。 其次,模式确定后,可获得一份报告,说明该事件发生在何时何地、显示事件发生的系列图件。例如, 机动车辆事故常常符合特定模式,该模式(即事故)发生在何处?发生地点与时间有关吗?是不是在某种 特定的交叉处?在这些交叉处又具有什么条件? 5)模型(Models ) 该类问题的解决需要建立新的数据关系以产生解决方案。 首先,建立模型,如选择标准、检验方法等。 其次,建立了一个或多个模型后,能产生满足特定的所有特征的列表,并着重显示被选择特征的地图, 而且提供一个有关所选择的特征详细描述的报表。例如要兴建一个儿童书店,用来选址的评价指标可能包 括 10、15 、20 分钟可到达的空间区域。附近居住的 10 岁或 10 岁以下的儿童的人数、附近家庭的收入情 况、周围潜在竞争的情况。 为了完成上述的地理信息系统的核心任务,需要采用不同的功能来实现它们。尽管目前商用 GIS 软件 包的优缺点是不同的,而且它们在实现这些功能所采用的技术也是不一样的,但是大多数商用 GIS 软件包 都提供了如下功能:数据的获取(Data Acquisition ) 、数据的初步处理(Preliminary data Processing ) 、数据 的存储及检索( Storage and Retrieval)、数据的查询与分析(Search and Analysis )、图形的显示与交互( Display and Interaction)。 图 1-8 说明了这些功能之间的关系,以及它们操作(Manipulation )数据的不同表现。 从图 1-8 中可以看出,数据获取是从现实世界的观测、以及从现存文件、地图中获取数据。有些数据 已经是 数字 化的 形式 , 但 是往往 需要 进行 数据 预处 理, 将原 始数 据转换 为结 构化的 数据 , 以使其 能够 被 系 统 查 询 和 分析。 查询 分析是 求 取 数 据 的 子 集 或 对 其 进 行 转换, 并交 互现 实结果 。 在 整个 处理 过程 中, 都 需 要数据存储检索以及交互表现的支持,换言之,这两项功能贯穿了地理信息系统数据处理的始终。 制图 结构化数据 交互展示 原始数据 观察的的现象、 文件与地图 存储与 检索 数据预处理 查询与分析 展示与 交互 数据获取 数据库 图 1-8:GIS 功能概述(椭圆)以及它们的表现(矩形) 空间信息处理和分析的六个组成部分 [丁跃民 ] 1)空间操作,如地图的并、交、差运算,缓冲区计算,选择等等; 2)空间统计分析,用于描述和分析空间数据的关系,如空间自相关分析; 3)空间 模型, 注重于 空间现 象、空 间结构、 空间关系 和空间 位置的分 析,如网 络分析 和水系生 成等 等; 4)空间表现 /可视化,侧重于表达空间信息; 5)空间数据库管理,包括空间数据库设计,空间数据结构,空间数据管理和空间查询。 6)空间模型库管理,包括为空间决策支持系统提供模型的管理等等。 3. 1 数据采集、监测与编辑 主要用 于获 取数 据, 保证 地理信 息系 统数 据库 中的 数据在 内容 与空 间上 的完 整性、 数值 逻辑 一致 性与 正确性 等 。 一 般 而 论 , 地 理信息 系统 数据 库的 建设 占整个 系统 建设 投资 的 70%或 更多, 并且 这种 比例在 近 期内不 会有 明显 的改 变。 因此 , 信 息共 享与自 动化 数据输 入成 为地 理信 息系 统研究 的重 要内 容。 目前 可 用 于地理 信息 系统 数据 采集 的方法 与技 术很 多 , 有 些 仅用于 地理 信息 系统 , 如 手扶跟 踪数 字化 仪 ; 目 前 , 自 动化扫 描输 入与 遥感 数据 集成最 为人 们所 关注 。 扫 描技术 的应 用与 改进 , 实 现扫描 数据 的自 动化 编辑 与处 理仍是地理信息系统数据获取研究的主要技术关键。 3. 2 数据处理 初步的数据处理主要包括数据格式化、转换、概括。数据的格式化是指不同数据结构的数据间变换, 是一种耗时、易错、需要大量计算量的工作,应尽可能避免;数据转换包括数据格式转化、数据比例尺的 变化等。在数据格式的转换方式上,矢量到栅格的转换要比其逆运算快速、简单。数据比例尺的变换涉及 到数据比例尺缩放、平移、旋转等方面,其中最为重要的是投影变换;制图综合( Generalization)包括数 据平滑、特征集结等。目前地理信息系统所提供的数据概括功能极弱,与地图综合的要求还有很大差距, 需要进一步发展。 3. 3 数据存储与组织 这是建立地理信息系统数据库的关键步骤,涉及到空间数据和属性数据的组织。栅格模型、矢量模型 或栅格/ 矢量混合模型是常用的空间数据组织方法。空间数据结构的选择在一定程度上决定了系统所能执行 的数据与分析的功能;在地理数据组织与管理中,最为关键的是如何将空间数据与属性数据融合为一体。 目前大多数系统都是将二者分开存储,通过公共项(一般定义为地物标识码)来连接。这种组织方式的缺 点是数据的定义与数据操作相分离,无法有效记录地物在时间域上的变化属性。 3. 4 空间查询与分析 空间查询是地理信息系统以及许多其它自动化地理数据处理系统应具备的最基本的分析功能;而空间 分析是地理信息系统的核心功能,也是地理信息系统与其它计算机系统的根本区别,模型分析是在地理信 息系统支持下,分析和解决现实世界中与空间相关的问题,它是地理信息系统应用深化的重要标志。地理 信息系统的空间分析可分为三个不同的层次。 3. 4. 1 空间检索 包括从空间位置检索空间物体及其属性和从属性条件集检索空间物体。“空间索引”是空间检索的关 键技术,如何有效地从大型的地理信息系统数据库中检索出所需信息,将影响地理信息系统的分析能力; 另一方面,空间物体的图形表达也是空间检索的重要部分。 3. 4. 2 空间拓扑叠加分析 空间拓扑叠加实现了输入要素属性的合并( Union)以及要素属性在空间上的连接(Join) 。空间拓扑叠 加本质是空间意义上的布尔运算。 3. 4. 3 空间模型分析 在空间模型分析方面,目前多数研究工作着重于如何将地理信息系统与空间模型分析相结合。其研究 可分三类: 第一类是地理信息系统外部的空间模型分析,将地理信息系统当作一个通用的空间数据库,而空间模 型分析功能则借助于其它软件; 第二类是地理信息系统内部的空间模型分析,试图利用地理信息系统软件来提供空间分析模块以及发 展适用于问题解决模型的宏语言,这种方法一般基于空间分析的复杂性与多样性,易于理解和应用,但由 于地理 信息 系统 软件 所能 提供空 间分 析功 能极 为有 限, 这种 紧密 结合 的空 间 模型分 析方 法在 实际 地理 信息 系统的设计中较少使用; 第三类 是混 合型 的空 间模 型分析 , 其 宗旨 在于 尽可 能地利 用地 理信 息系 统所 提供的 功能 , 同 时也 充分 发挥地理信息系统使用者的能动性。 3. 5 图形与交互显示 地理信 息系 统为 用户 提供 了许多 用于 地理 数据 表现 的工具 , 其 形式 既可 以是 计算机 屏幕 显示 , 也 可以 是诸如 报告 、 表 格 、 地图 等硬拷 贝图 件 , 尤 其 要 强 调的是 地理 信息 系统 的地 图输出 功能 。 一 个 好 的 地 理 信 息系统 应能 提供 一种 良好 的、 交 互 式 的 制 图 环 境 , 以供地 理信 息系 统的 使用 者能够 设计 和制 作出 高质 量的 地图。 4.地理信息系统的研究内容 4. 1 研究内容 地理信 息系 统是 在地 理学 研究和 生产 实践 的需 求中 产生, 地理 信息 系统 的应 用使技 术系 统不 断完 善 , 并逐渐 发展 了地 理信 息系 统的理 论; 理论 研究 又指 导开发 新一 代高 效地 理信 息系统 , 并 不断 拓宽 其应 用领 域, 加深 应用 的深 度 ; 地 理信息 系统 的应 用 , 又 对 理论研 究和 技术 方法 提出 了更高 的要 求 。 这 三 个 方 面 的 研究内容是相互联系相互促进的。地理信息系统研究的内容主要有以下三个方面,见图 1-9 所示。 地理信息系统工具 应用方法 技术系统 基本理论 地理信息系统 用户界面等 空间数据管理 概念、定义、内涵 理论体系构成、特点、功能、任务 发展历史与发展方向 硬件配置 数据结构 地学专家系统 专题分析模型 输入、输出系统 应用系统设计 数据采集与校验 图 1-9:地理信息系统内容体系 4. 1. 1 地理信息系统基本理论研究 包括研 究地 理信 息系 统的 概念 、 定 义和 内涵 ; 地 理 信息系 统的 信息 论研 究; 建立地 理信 息系 统的 理论 体系; 研究 地理 信息 系统 的构成 、 功 能、 特点 和任 务; 总 结 地 理 信 息 系 统 的 发展历 史, 探讨 地理 信息 系统 发展方向等理论问题。 4. 1. 2 地理信息系统技术系统设计 包括地 理信 息系 统硬 件设 计与配 置 ; 地 理空间 数据 结构及 表示 ; 输入与 输出 系统 ; 空 间数 据库管 理 系 统 ; 用 户 界 面 与 用 户 工具设 计; 地理 信息 系统 工具软 件 研制; 微机 地理 信息系 统 的 开 发 ; 网 络地 理信息 系 统的研制等。 4. 1. 3 地理信息系统应用方法研究 包括应 用系 统设 计和 实现 方法 ; 数 据采 集与校 验 ; 空间分 析函 数与 专题 分析 模型 ; 地 理信 息系统 与遥 感技术结合方法;地学专家系统研究等。 总之 , 地 理信 息系 统的 内 容主要 包括 : 有 关 的 计 算 机 软 /硬 件 ; 空间 数据 的获 取及计 算机 输入 ; 空 间 数 据模型 及数 字表 达; 数据 的数据 库存 储及 处理 ; 数 据的共 享、 分析 与应 用; 数据的 显示 与视 觉化 ; 地 理信 息系统的网络化等等。 4. 2 地理信息系统相关学科 地理信 息系 统 , 是六 十年 代开始 迅速 发展 起来 的地 理学研 究的 新技 术, 是多 种学科 交叉 的产 物。 作 为 传统科 学与 现代 技术 相结 合的产 物, 地理 信息 系统 为各种 涉及 空间 数据 分析 的学科 提供 了新 的方 法, 而这 些学科 的发 展都 不同 程度 地提供 了一 些构 成地 理信 息系统 的技 术与 方法 。 为 了更好 地掌 握并 深刻 地理 解地 理信息系统,有必要认识和理解与地理信息系统相关的学科。 地理学 是一 门研 究人 类生 活空间 的学 科 , 地 理 学 研 究空间 分析 的传 统历 史悠 久, 它 为 GIS 提供 了一 些 空间分 析的 方法 与观 点, 成为 GIS 部分 理论 的依 托 。 地理 学的 许多 分支 学科 , 如 地 图学、 大地 测量 学 等 都 与 GIS 有 着 密 切 的 相 依 关 系 。 另 一 方 面 , 地理 信息 系统也 以一 种新 的思 想和 新的技 术手 段解 决地 理学 的问 题,使地理学研究的数学传统得到充分发挥。地理信息系统的相关学科见图 1-10。 地理学 计算机 科学 软件工 程 数据库 技术 CAD 专家系 统计算机 图形 学 制图技 术 遥感技 术GIS 图 1-10:地理信息系统相关学科 4. 2. 1 地理学 地理学 是一 门研 究人 类赖 以生存 的空 间的 科学 。 在 地理学 研究 中, 空间 分析 的理论 和方 法具 有悠 久的 历史,它为地理信息系统提供了有关空间分析的基本观点与方法,成为地理信息系统的基础理论依托。而 地理信息系统的发展也为地理问题的解决提供了全新的技术手段,并使地理学研究的数学传统得到了充分 地发挥。 地理系统的内部及其外界,不仅存在着物质和能量的交流,还存在着信息流,这种信息交流使得系统 许多似不相关的形态各异的要素联系起来,共同作用于地理系统。而地理信息系统体现着一种信息联系, 由系统建立者输入,而由机器存储的各种影像、地图和图表都包含了丰富的地理空间信息的数据,通过指 针或索引等组织信息相关联;系统软件对空间数据编码解码和处理;用户对 GIS 发出指令, GIS 按约定的 方式做出解释后,获得用户指令信息,调用系统内的数据提取相应的信息,从而对用户做出反应,这是信 息按一定方式流动的过程。 由此可见,地理信息系统不仅要以信息的形式表达自然界实体之间物质与能量的流动,更为重要的是 以最直接的方式反映了自然界的信息联系,并可以快速模拟这种联系发展的结果,达到地理预测的目的。 总之,自然界与人类存在着深刻的信息联系,地理学家所面对的是一个形体的、即自然的地理世界, 而感受到的却是一个地理信息世界。地理研究实际上是基于这个与真实世界并存而且在信息意义上等价的 信息世界的, GIS 以地理信息世界表达地理现实世界,可以真实、快速地模拟各种自然的过程和思维的过 程,对地理研究和预测具有十分重要的作用。 4. 2. 2 地图学 地图是记录地理信息的一种图形语言形式,从历史发展的角度来看,地理信息系统脱胎于地图,地图 学理论与方法对地理信息系统的发展有着重要的影响。 GIS 是地图信息的又一种新的载体形式,它具有存 储、分析、显示和传输空间信息的功能,尤其是计算机制图为地图特征的数字表达、操作和显示提供了一 系列方法,为地理信息系统的图形输出设计提供了技术支持;同时,地图仍是目前地理信息系统的重要数 据来源之一。但二者又有本质之区别:地图强调的是数据分析、符号化与显示,而地理信息系统更注重于 信息分析。 地图是认识和分析研究客观世界的常用手段,尽管地图的表现形式发生了种种变化,但是依然可以认 为构成地图的主要因素有三:地图图形、数学要素和辅助要素。地图图形是用地图符号所表示的制图区域 内,各种自然和社会经济现象的分布、联系以及时间变化等的内容部分(又称地理要素),如江河山地、 平原、土质植被、居民点、道路、行政界限或其他专题内容等,这是地图构成要素中的主体部分。数学要 素是决定图形分布位置和几何精度的数学基础,是地图的“骨架” 。其中包括地图投影及坐标网、比例尺、 大地控制点等。地图投影是用数学方法将地球椭球面上的图形转绘到平面上;坐标网是各种地图的数学基 础,是地图上不可缺少的要素;比例尺表示坐标网和地图图形的缩小程度;大地控制点是保证将地球的自 然表面转绘到椭球面上,再转绘到平面直角坐标网内时,具有精确的地理位置。辅助要素是为了便于读图 与用图而设置的。如图例就是显示地图内容的各种符号的说明,还有图名、地图编制和出版单位、编图时 间和所用编图资料的情况、出版年月等。有的地图上还有补充资料,用以补充和丰富地图的内容。如在图 边或图廓内空白处,绘制一些补充地图或剖面图、统计图等。有时还有一些表格或某一方面的重点文字说 明。 从地理信息系统的发展过程可以看出,地理信息系统的产生、发展与制图系统存在着密切的联系,两 者的相通之处是基于空间数据库的表达、显示和处理。从系统构成与功能上看,一个地理信息系统具有机 助制图系统的所有组成和功能,并且地理信息系统还有数据处理的功能。地图是一种图解图像,是根据地 理思想对现实世界进行科学抽象和符号表示的一种地理模型,是地理思维的产物,也是实体世界地理信息 的高效载体,地图可以从不同方面、不同专题,系统地记录和传输实体世界历史的、现在的和规划预测的 地理景观信息。 4. 2. 3 计算机科学 地理信息系统技术的创立和发展是与地理空间信息的表达、处理、分析和应用手段的不断发展分不开 的。二十世纪六十年代初,在计算机图形学的基础上出现了计算机化的数字地图。地理信息系统与计算机 的数据库技术(DBMS) 、计算机辅助设计(CAD) 、计算机辅助制图(CAM) 和计算机图形学(Computer Graphics) 等有着密切的联系。但是它们却无法取代地理信息系统的作用。 数据库管理系统(Database Management System) 是操作和管理数据库的软件系统,提供可被多个应用程 序和用户调用的软件系统,支持可被多个应用程序和用户调用的数据库的建立、更新、查询和维护功能, GIS 在数据管理上借鉴 DBMS 的理论和方法,非几何属性数据有时也采用通用 DBMS 或在其上开发的软 件系统管理;对于空间地理数据的管理,通用的 DBMS 有两个明显的弱点:第一,缺乏空间实体定义能力: 目前流行的网状结构、层次结构、关系结构等,都难以对空间结构全面、灵活、高效地加以描述;第二, 缺乏空间关系查询能力:通用的 DBMS 的查询主要是针对实体的查询,而 GIS 中则要求对实体的空间关 系进行查询,如关于方位、距离、包容、相邻、相交和空间覆盖关系等,显然,通用 DBMS 难以实现对地 理数据空间查询和空间分析。数据是信息的载体,对数据进行解释可提取信息,通用数据库和地理数据库 都是针对数据本身进行管理,而 GIS 则在数据管理基础上,通过地理模型运算,产生有用的地理信息,取 得信息的多少和质量,与地理模型的水平密切相关。 计算机图形学是利用计算机处理图形信息以及借助图形信息进行人——机通讯处理的技术,是 GIS 算 法设计的基础。 GIS 是随着计算机图形学技术的发展而不断发展完善的,但是计算机图形学所处理的图形 数据是不包含地理属性的纯几何图形,是地理空间数据的几何抽象,可以实现 GIS 底层的图形操作,但不 能完成数据的地理模型分析和许多具有地理意义的数据处理,不能构成完整的 GIS。 计算机辅助设计(CAD,Computer-Aided Design) 是通过计算机辅助设计人员进行设计,以提高设计的自 动化程度,节省人力和时间;专门用于制图的计算机辅助制图 (Computer-Aided Mapping),采用计算机进行 几何图形的编辑和绘制。 GIS 与 CAD 和 CAM 的区别在于:第一, CAD 不能建立地理坐标系和完成地理 坐标变换;第二, GIS 的数据量比 CAD、CAM 大得多,结构更为复杂,数据间联系紧密,这是因为 GIS 涉及的区域广泛,精度要求高,变化复杂,要素众多,相互关联,单一结构难以完整描述;第三, CAD 和 CAM 不具备 GIS 具有地理意义的空间查询和分析功能。 4. 2. 4 遥感 遥感是一种不通过直接接触目标物而获得其信息的一种新型的探测技术。它通常是指获取和处理地球 表面的信息,尤其是自然资源与人文环境方面的信息,并最后反映在像片或数字影像上的技术。影像通常 需要进一步处理方可使用,用于该目的的技术称为图像处理。图像处理包括各种可以对像片或数字影像进 行处理的操作,这些操作包括影像压缩,影像存储,影像增强、处理以及量化影像模式识别等。目前,遥 感已经成为环境研究中极有价值的工具,不同学科的专业人员不断地发现航空遥感不同数据在各领域内的 潜在应用。遥感和图像处理技术被用于获取和处理地球表面有关的信息; GIS 的发展则源于对土地属性信 息与相应几何表达的集成及空间分析的需求。这两项技术在过去是相互独立发展的,尽管他们实际上是互 补的。从地理信息系统本身的角度出发,随着它应用领域的开拓和深入,它首先要求存储大量的有关数据, 通过不断的积累和延伸,从而具备反映自然历史过程和人为影响的趋势的能力,揭示事物发展的内在规律。 但是地理信息系统数据库几乎只是通过地图数字化建立起来的,用户不能接触到原始资料及其有关信息, 而地理信息系统中的原始数据却是有效地模拟和控制误差传播的基础。其次,地理信息系统为了保持系统 的动态性和现势性,它还要求及时地更新系统中的数据,目前地理信息系统中存储的信息只是现实世界的 一个静态模型,需要定时或及时的更新。遥感作为一种获取和更新空间数据的强有力手段,能及时地提供 准确、综合和大范围内进行动态检测的各种资源与环境数据,因此遥感信息就成为地理信息系统十分重要 的信息源。另一方面 GIS 中的数据可以作为遥感影像分析的一种辅助数据。在两者集成过程中, GIS 主要 用于数据处理、操作和分析;而遥感则作为一种数据获取、维护与更新 GIS 中的数据的手段,此外, GIS 可用于基于知识的遥感影像分析。地理信息系统和遥感是两个相互独立发展起来的技术领域,随着它们应 用领域的不断开拓和自身的不断发展,即由定性到定量、由静态到动态、由现状描述到预测预报的不断深 入和提高。它们的结合也逐渐由低级向高级阶段发展。遥感和地理信息系统的结合经历了由低级向高级阶 段的发展过程。最早的结合工作包括把航空遥感像片经目视判读和处理后编制成各种类型的专题图,然后 将它们数字化和输入地理信息系统;从 70 年代中后期开始,各种影像分析系统得到了迅速而广泛地发展。 大量的遥感数据以及图像分析系统图像分类所形成的各类专题信息,可以直接输入地理信息系统,整个过 程能在“全数字”的环境下进行,图像数据能够在生成编辑地图的屏幕上显示,标志着遥感和地理信息系 统的结合进入了新的阶段。 遥感作为空间数据采集手段,已成为地理信息系统的主要信息源与数据更新途径。遥感图像处理系统 包含若干复杂的解析函数,并有许多方法用于信息的增强与分类。另外,大地测量为地理信息系统提供了 精确定位的控制系统,尤其是全球定位系统( GPS)可快速、廉价地获得地表特征的熟悉位置信息。航空 像片及其精确测量方法的应用使得摄影测量成为地理信息系统主要的地形数据来源。总之,遥感是地理信 息系统的主要数据源与更新手段,同时,地理信息系统的应用又进一步支持遥感信息的综合开发与利用。 4. 2. 5 管理科学 传统意义上的管理信息系统是以管理为目的,在计算机硬件和软件支持下具有存储、处理、管理和分 析数据能力的信息系统,如人才管理信息系统、财务管理信息系统、服务业管理信息系统等。这类信息系 统的最大特征是它处理的数据没有或者不包括空间特征。 另一类管理信息系统是以具有空间分析功能的地理信息系统为支持、以管理为目标的信息系统,它利 用地理信息系统的各种功能实现对具有空间特征的要素进行处理分析以达到管理区域系统的目的,如城市 交通管理信息系统、城市供水管理信息系统、节水农业管理信息系统等。 事实上,可以形象地把地理信息系统与其他学科的关系用一棵树来表示,如图 1-11 所示。 图 1-11: GIS 学科“树” [Charistopher.B.Jones] 正如上 图所 述, “树 根” 表 示 GIS 的技 术基 础, 如测量 学、 计算 机科 学与 数学等 ; “树 枝” 表示 GIS 的 应用, 应用 的结 果与 需求 返回到 “树 根” ; “雨 滴” 是每个 应用 中的 数据 来源 , 如 各 种 测 量 如 地 形 测 量 、 环 境测量 等 , 并 为它的 发展 提供了 有效 的手 段, 而地 理信息 系统 的应 用主 要是 在环境 科学 、 地理学 和社 会 科 学等领域。 5.地理信息系统发展简史 地理信 息系 统脱 胎于 地图 , 它 们 都是地 理信 息的 载 体 , 具 有获得 、 存 储 、 编 辑 、 处 理、 分 析与显 示地 理数据 的功 能 。 地图 是地 理学的 第二 代语 言, 而地 理信息 系统 将成 为地 理学 的第三 代语 言 。 二十 世纪 六 十 年代初 , 在 计 算 机 图 形 学 的基础 上出 现了 计算 机化 的数字 地图 。 1950 年 , 麻 省理工 学院 为它 的旋 风一 号计 算机制 造了 第一 台图 形显 示器 ; 1958 年, 美国 的一 公 司在联 机的 数字 记录 仪的 基础上 研制 成滚 筒式 绘图 仪; 1962 年, 麻省 理工 学院 的 一名研 究生 在其 博士 学位 论文中 , 首 次 提 出 了 计 算 机图形 学的 术语 , 并 论 证 了 交 互式计 算机 图形 学是 一个 可行的 、有 用的 研究 领域 ,从而 确立 了这 一科 学分 支的独 立地 位。 在此 基础 上 , 地理信息系统发展起来。 5. 1 六十年代开拓发展阶段 六十年 代初 , 计 算 机 技 术 开始用 于地 图量 算 、 分 析 和制作 , 由 于 机 助 制 图 具 有快速 、 廉 价 、 灵活 多样、 易于更新、操作简便、质量可靠、便于存储、量测、分类、合并和覆盖分析等优点而迅速发展起来。六十 年代中期,由于对于自然资源和环境的规划管理和应用加速增长的需要,对大量空间环境数据存储、分析 和显示技术方法改进的要求,以及计算机技术及其在自然资源和环境数据处理中应用的迅速发展,促使对 地图进行综合分析和输出的系统日益增多。 六十年代中后期,许多与 GIS 有关的组织和机构纷纷建立并开展工作,如美国城市和区域系统协会 (URISA )在 1966 年成立,美国州信息系统全国协会( NASIS)在 1969 年成立,城市信息系统跨机构委 员会( UAAC)在 1968 年成立,国际地理联合会(IGU )的地理数据遥感和处理小组委员会在 1968 年成 立等。这些组织和机构相继组织了一系列地理信息系统的国际讨论会。 最初的系统主要是关于城市和土地利用的,如加拿大地理信息系统( CGIS)就是为处理加拿大土地调 查获得的大量数据建立的。该系统由加拿大政府组织于 1963 年开始研制实施,到 1971 年投入正式运行, 被认为是国际上最早建立的、较为完善的大型使用的地理信息系统。 由于计算机硬件系统功能较弱,限制了软件技术的发展。这一时期地理信息系统软件的研制主要是针 对具体的 GIS 应用进行的,到六十年代末期,针对 GIS 一些具体功能的软件技术有了较大进展。 第一,栅格——矢量转换技术、自动拓扑编码以及多边形中拓扑误差检测等方法得以发展,开辟了分 别处理图形和属性数据的途径; 第二,具属性数据的单张或部分图幅可以与其他图幅或部分在图边自动拼接,从而构成一幅更大的图 件,使小型计算机能够分块处理较大空间范围(或图幅)的数据文件; 第三,采用命令语言建立空间数据管理系统,对属性再分类、分解线段、合并多边形、改变比例尺、 测量面积、产生图和新的多边形、按属性搜索、输出表格和报告以及多边形的叠加处理等。 这一时期的软件主要针对当时的主机和外设开发的,算法尚嫌粗糙,图形功能有限。 5. 2 七十年代巩固阶段 进入七十年代以后,由于计算机硬件和软件技术的飞速发展,尤其是大容量存取设备——硬盘的使用, 为空间数据的录入、存储、检索和输出提供了强有力的手段。用户屏幕和图形、图像卡的发展增强了人机 对话和高质量图形显示功能,促使 GIS 朝着使用方向迅速发展。一些发达国家先后建立了许多不同专题、 不同规模、不同类型的各具特色的地理信息系统。如美国森林调查局发展了全国林业统一使用的资源信息 显示系统;美国地质调查所发展了多个地理信息系统用于获取和处理地质、地理、地形和水资源信息较典 型的有 GIRAS;日本国土地理院从 1974 年开始建立数字国土信息系统,存储、处理和检索测量数据、航 空像片信息、行政区划、土地利用、地形地质等信息,为国家和地区土地规划服务;瑞典在中央、区域和 市三级上建立了许多信息系统,比较典型的如区域统计数据库、道路数据库、土地测量信息系统、斯德哥 尔摩地理信息系统、 城市规划信息系统等;法国建立了地理数据库 GITAN 系统和深部地球物理信息系统等。 此外,探讨以遥感数据为基础的地理信息系统逐渐受到重视,如将遥感纳入地理信息系统的可能性、 接口问题以及遥感支持的信息系统的结构和构成等问题;美国喷气推动实验室( JPL)在 1976 年研制成功 兼具影像数据处理和地理信息系统功能的影像信息系统 IBIS(Image Based Information System ) ,可以处理 Landsat 影像多光谱数据; NASA 的地球资源实验室在 1979 年至 1980 年发展了一个名为 ELAS 的地理信息 系统,该系统可以接受 Landsat MSS 影像数据、数字化地图数据、机载热红外多波段扫描仪以及海洋卫星 合成孔径雷达的数据等,产生地面覆盖专题图。 由于这一时期 GIS 的需求增加,许多团体、机构和公司开展了 GIS 的研制工作,推动 GIS 软件的发展。 据 IGU 地理数据遥测和处理小组委员会 1976 年的调查,处理空间数据的软件已有 600 多个,完整的 GIS 有 80 多个。这一时期地图数字化输入技术有了一定的进展,采用人机交互方式,易于编辑修改,提高了工 作效率,扫描输入技术系统出现。图形功能扩展不大,数据管理能力也较小。这一时期软件最重要的进展 是人机图形交互技术的发展。 5. 3 八十年代突破阶段 由于计算机的发展,推出了图形工作站和个人计算机等性能价格比大为提高的新一代计算机,计算机 和空间信息系统在许多部门广泛应用。随着计算机软、硬件技术的发展和普及,地理信息系统也逐渐走向 成熟。这一时期是地理信息系统发展的重要时期。计算机价格的大幅度下降,功能较强的微型计算机系统 的普及和图形输入、输出和存储设备的快速发展,大大推动了地理信息系统软件的发展,并研制了大量的 微机 GIS 软件系统。由于微机系统的软件环境限制较严,使得在微机 GIS 中发展的许多算法和软件技术具 有很高的效率, GIS 软件技术在以下几个方面有了很大的突破。在栅格扫描输入的数据处理方面,尽管扫 描数据的处理要花费很长的机时(与扫描时间相比为 10: 1),但是仍可大大提高数据输入的效率;在数据 存储和运算方面,随着硬件技术的发展, GIS 软件处理的数据量和复杂程度大大提高,许多软件技术固化 到专用的处理器中;而且遥感影像的自动校正、实体识别、影像增强和专家系统分析软件也明显增加;在 数据输出方面,与硬件技术相配合, GIS 软件可支持多种形式的地图输出;在地理信息管理方面,除了 DBMS 技术已发展到支持大型地图数据库的水平外,专门研制的适合 GIS 空间关系表达和分析的空间数据库管理 系统也有了很大的发展。 总之,这一时期的地理信息系统的发展有如下特点: 第一,在七十年代技术开发的基础上,地理信息系统技术全面推向应用; 第二,开展工作的国家和地区更为广泛,国际合作日益加强,开始探讨建立国际性的地理信息系统, 地理信息系统由发达国家推向发展中国家,如中国; 第三,地理信息系统技术进入多种学科领域,从比较简单的、单一功能的、分散的系统发展到多功能 的、共享的综合性信息系统,并向智能化发展,新型的地理信息系统将运用专家系统知识,进行分析、预 报和决策; 第四,微机地理信息系统蓬勃发展,并得到广泛应用。在地理信息系统理论指导下研制的地理信息系 统工具具有高效率和更强的独立性和通用性,更少依赖于应用领域和计算机硬件环境,为地理信息系统的 建立和应用开辟了新的途径。 我国地理信息系统方面的工作自八十年代初开始。以 1980 年中国科学院遥感应用研究所成立的全国第 一个地理信息系统研究室为标志,在几年的起步发展阶段中,我国地理信息系统在理论探索、硬件配制、 软件研制、规范制定、局部系统建立、初步应用实验和技术队伍培养等方面都取得了进步,积累了经验, 为全国范围内开展地理信息系统的研制和应用奠定了基础。 5. 4 九十年代社会化阶段 进入九十年代,随着地理信息产业的建立和数字化信息产品在全世界的普及,地理信息系统将深入到 各行各业乃至各家各户,成为人们生产、生活、学习和工作中不可缺少的工具和助手。地理信息系统已成 为许多机构必备的工作系统,尤其是政府决策部门在一定程度上由于受地理信息系统影响而改变了现有机 构的运行方式、设置与工作计划等。而且,社会对地理信息系统认识普遍提高,需求大幅度增加,从而导 致地理信息系统应用的扩大与深化。国家级乃至全球性的地理信息系统已成为公众关注的问题。 自九十年代起,中国地理信息系统步入快速发展阶段。力图使地理信息系统从初步发展时期的实验、 局部应用走向实用化和生产化,为国民经济重大问题提供分析和决策依据。同时地理信息系统的研究和应 用正逐步形成行业,具备了走向产业化的条件。 表 1-1:从 60 年代以来地理信息系统发展中重要的历史事件 1960 美国空军 CIA 首次成功地发射 CORONA 1963 Roger Tomlinson 开始了加拿大地理信息系统的开发 1963 Dr. Edgar Horwood 建立了城市与区域信息系统联合会(URISA) 1964 Howard Fisher 建立了计算机图形和空间分析的哈佛实验室 1966 SYMAP 系统在西北技术学院研制并在哈佛实验室完成 1967 DIME(双重独立制图编码)为美国人口普查局所研制 1969 Jack 和 Laura Dangermond 建立了环境系统研究所(ESRI) 1969 Jim Meadlock 建立了 Integraph 公司 1969 在英国诞生了激光扫描仪 1969 Ian McHarg 很有影响的书“自然设计(Design With Nature) ”出版 1971 加拿大地理信息(CGIS )建立 1972 IBM 的 GFIS 发布 1972 GISP(General Information System for Planning )开发 1972 Landsat 卫星首次发射成功 1973 USGS 研制了地理信息提取和分析系统 1973 马里兰自动地理信息(MAGI, Maryland Automatic Geographic Information) 开发 1974 在伦敦的皇家艺术学院建立了试验制图单元(ECU, Experimental Cartography Unit) 1974 首次自动制图会议在 Reston, 弗吉尼亚召开 1976 明尼苏达研制了明尼苏达土地管理信息系统 1977 USGS 研制了数字化线图(DLG)空间数据模式 1978 ERDAS 成立 1978 地图叠加复合与统计系统开发 1979 哈佛图形实验室研制了 ODYSSEY GIS 1981 ESRI ARC/ INFO GIS 发布 1982 NASA 发射了 Landsat TM4 1983 ETAK 数字制图公司成立 1984 Marble, Calkins & Peuquet 出版了“地理信息系统的基本读物”(Basic Readings in Geographic Information Systems) 1984 第一届国际空间数据处理会议召开 1984 Landsat 商业化 1984 NASA 发射 Landsat TM5 1985 GPS 成为可运行系统 1985 美国军队建筑工程实验室开始研制 GRASS( Geographic Resources Analysis Support Systems,地理资源分析支持系统) 1986 MapInfo 建立 1986 Peter Burrough 出版了“土地资源评估的地理信息系统原理”(Principles of Geographic Information Systems for Land Resources Assessment) 1986 SPOT 卫星首次发射 1987 “地理信息系统的国际杂志” 出版 1987 Tydac SPANS GIS 发布 1987 科拉克大学开始 Idrisi 项目 1988 美国人口调查局第一次公开发布 TIGER 1988 纽约州立大学开始研制 GIS-L Internet list-server 1988 GIS World 首次发行 1988 首次 GIS/ LIS 会议举行 1988 英国的区域研究实验室成立 1988 Small World 公司成立 1989 在英国成立了地理信息系统联合会(AGI) 1989 Stan Arnoff 出版了“地理信息系统:一个管理透视” (Geographic Information Systems: a Management Perspective) 1989 Intergraph 发布 MGE 1991 Maguire, Goodchild 和 Rhind 出版了“地理信息系统:原理和应用” 1992 MAPS ALIVE 发行 1993 Digital Matrix Systems 发布了 InFoCAD for Windows NT 第一个版本,它是第一个 基于 Win NT 的 GIS 软件 1994 OGC 形成(David Schell, Ken Gardells, Kurt Buehler,et al ) 1995 MapInfo 专业版发布 1999 NASA 发射了 Landsat TM7 6. GIS 的发展展望 6. 1GIS 理论研究中及待解决的问题 6. 1. 1GIS 理论发展的需求 GIS 是一门技术引导的多技术交叉的信息空间科学,它是对地理信息数据(包括图形和非图形数据, 几何数据与属性数据)进行采集、存储、加工和再现,并能回答一系列问题的计算机系统,所以它必然是 技术导向的。 GIS 不断地用新的技术和方法来装备和发展自己,它在技术上所关注的是:数据采集;数据 建模;数据的精度和系统回答问题的可信度;数据量;数据存取与保密;数据分析;用户接口;成本与效 益; GIS 系统的寿命;GIS 系统工作的组织问题。这些技术问题,将会随着相关学科和软件、硬件手段的 不断进步,而日趋完善。同时, GIS 是一门以应用为目的的信息产业,即 GIS 也是应用导向的,即它除了 具有基础性和公益性特点,服务于科学研究和造福人类外,它还具有实际应用并创造价值的广阔市场。 GIS 的应用可以深入到各个领域、各个机构,形成诸如资源 GIS,灾害监测和防治 GIS,农林牧副渔 GIS 等。 GIS 的不断发展,它既依赖于地理学、统计学和测量学这些基础学科,又取决于计算机软件技术、航天技 术、遥感技术和人工智能与专家系统技术的进步与成就。它是位于地学与技术科学的边缘,但本质上已是 信息科学的一个组成部分。 随着 GIS 理论的发展与完善,以及人们对空间信息需求量的增大,为了使得 GIS 系统得到可持续的发 展,则必须使 GIS 向集成化和智能化方向发展,该方向包括以下几个方面: 1)图形数据和属性数据的结合:最初,图形和属性数据是完全分开的;然后,通过内部连接,将二者 联系起来;再次,进行了混合处理;最后,达到完全的结合。未来 GIS 要求的是将二者的完全的结合。 2) GIS 与 RS 的结合:遥感是地理信息系统重要的数据源和数据更新的手段。相反, GIS 则是遥感中 数据处理的辅助信息,用于语义和非语义信息的自动提取。 GIS 与 RS 可能的结合方式包括:分开但是平 行的结合(不同的用户界面、不同的工具库和不同的数据库)、表面无缝的结合(同一用户界面,不同的 工具库和不同的数据库)和整体的结合(同一个用户界面、工具库和数据库)。未来要求的是整体的结合。 3) GIS 与 GPS 和 CCD 技术的结合: GPS 是全球定位系统,利用 GPS 接收机,可以直接测定地面上 任一点的三维坐标。 GPS 与 GIS 相结合可以实现电子导航,用于交通管理、公安侦破、自动导航,也可以 用作 GIS 实时更新。如果再加上 CCD 摄象机实时摄象和配以影像处理,则可以形成实时 GIS 运行系统, 用于公路、铁路线路状况的自动监测和管理,以及作战指挥系统等。 4) GIS 与专家系统(Expert System )的结合:由于 GIS 是一个基于地理数据的空间信息系统,它必须 具有自动采集和处理数据的功能,而且能够智能化地分析和运用数据,提供科学的决策咨询,以回答用户 可能提出的各种复杂问题。从这个意义 GIS 与 ES 相结合,形成智能化的高度集成 GIS 系统。 6. 1. 2 GIS 理论研究中及待解决的问题 基于以上的分析,要想得到一个理想的 GIS 系统,需要 GIS 理论上解决以下的主要问题: 1) GIS 设计与实现的方法学问题 由于缺乏严格的工程管理和好的分析设计方法支持,导致了 GIS 软件系统的可靠性和可维护性差。这 是一个长期以来人们一直在尽力解决但还未解决的问题。 2) GIS 的功能问题 当前以数据采集、存储、管理和查询检索功能为主的 GIS,还不能完全满足社会和区域可持续发展在 空间分析、预测预报、决策支持等方面的要求,直接影响到 GIS 的应用效益和生命力。 3)多媒体地理信息系统的管理和操作的问题 在一个多种数据类型并存的混合系统中,如何实现对各类数据的随意操作和有效管理,这是现今信息 媒体多元化新时代的突出问题,它比单一地图数据库的操作和管理更复杂。 4) GIS 地理信息的深加工问题 目前的 GIS 还远未发挥它提供结论性专题地图和数据集方面的作用, 这是涉及对 GIS 地理信息进行深 加工的问题。这种深加工的结果,可以是结论性专题地图,也可以是结论性专题数据集。这两种形式都是 必须的,前者提供结论性图形信息,后者提供结论性数字信息,提供经过深加工的结论性成果对用户更直 接和更有利。 5)空间信息可视化技术和虚拟现实技术( VR) 可视化技术已经远远超过了传统的符号化及视觉变量表示法的水平,进入了在动态、时空变换、多维 的可交互的地图条件下探索视觉效果和提高视觉工具功能的阶段,它的重点是要将那些通常难于设想和接 近的环境与事物,以动态直观的方式表现出来。 GIS 可视化方面的研究主要集中在以下几个方面:运用动 画技术制作动态地图,可用于涉及时空变化的现象或概念的可视化分析;运用 VR 技术进行地形环境仿真, 真实再现地景,用于交互式地观察和分析,提高对地形环境的认知效果;运用图形显示技术进行空间数据 的不确定性和可靠性的检查,把抽象数据可视化,由此发现规律;运用图形界面和交互式手段进行地图设 计和编辑,以直观的方式完成地图设计制作(如地图颜色的可视化设计);可视化技术用于视觉感受及空间 认知理论的研究。 6. 2 地理信息系统的发展动态 近年来地理信息系统技术发展迅速,其主要的原动力来自日益广泛的应用领域对地理信息系统不断提 出的要求。另一方面,计算机科学的飞速发展为地理信息系统提供了先进的工具和手段,许多计算机领域 的新技术,如面向对象技术、三维技术、图像处理和人工智能技术都可直接应用到地理信息系统中。下面 对当前地理信息系统研究中的几个热点研究领域作一介绍。 6. 2. 1GIS 软件中发展的热点 1) GIS 中面向对象技术研究 面向对象方法为人们通过计算机直接描述现实世界提供了一条适合于人类思维模式的方法,面向对象 的技术在 GIS 中的应用,即面向对象的 GIS,已成为 GIS 的发展方向。这是因为空间信息较之传统数据库 处理的一维信息更为复杂、繁琐,面向对象的方法为描述复杂的空间信息提供了一条直观、结构清晰、组 织有序的方法,因而倍受重视。 面向对象的 GIS 较之传统的 GIS 有下列优点: 1)所有的地物以对象形式封装,而不是以复杂的关系形式存储,使系统组织结构良好、清晰; 2)以对象为基础,消除了分层的概念; 3)面向对象的一般——特殊结构和整体——部分结构使 GIS 可以直接定义和处理复杂的地物类型; 4)根据面向对象后期绑定 * ( Late-binding)的思想,用户可以在现有抽象数据类型和空间操作箱上定 义自己所需的数据类型和空间操作方法,增强系统的开发性和可扩充性; 5)基于图标的面向对象的用户界面,便于用户操作和使用。面向对象的 GIS 也存在一些尚待进一步研 究的问题: 1)大对象的操作仍受硬件条件的限制; 2)对象的独立性与粒度问题; 3)矢量和栅格数据统一的、支持动态拓扑结构和复合对象表示的面向对象的数据结构问题。 * 后期绑定是面向对象编译器中的重要概念,采用该技术,一个对象所属的类可以在运行时刻(Run Time )指定,而不是在 编译成目标码时确定。 2)时空系统 传统的地理信息系统只考虑地物的空间特性,忽略了其时间特性。在许多应用领域中,如环境检测、 地震救援、天气预报等,空间对象是随时间变化的,而这种动态变化规律在求解过程中起着十分重要的作 用。过去 GIS 忽略时态主要是受软硬件条件的限制,也有技术方面的原因。近年来,对 GIS 中时态特性的 研究变得十分活跃,即所谓“时空系统” 。通常把 GIS 的时间维分成处理时间维和有效时间维,处理时间 又称数据库时间或系统时间,它指在 GIS 中处理发生的时间;有效时间亦称事件时间或实际时间,它指在 实际应用领域事件出现的时间。时空系统主要研究时空模型,时空数据的表示、存储、操作、查询和时空 分析。目前比较流行的作法是在现有数据模型基础上扩充,如在关系模型的元组中加入时间,在对象模型 中引入时间属性。在这种扩充的基础上如何解决从表示到分析的一系列问题仍有待进一步研究。 3)地理信息建模系统(GIMS-Geographic Information Modeling System ) 通用 GIS 的空间分析功能对于大多数的应用问题是远远不够的,因为这些领域都有自己独特的专用模 型,目前通用的 GIS 大多数通过提供二次开发的工具和环境来解决这一问题,但二次开发工具的一个主要 问题是它对于普通用户而言过于困难。而 GIS 成功应用到专门领域的关键在于支持建立该领域特有的空间 分析模型。 GIMS 的研究动向为:面向对象在 GIS 中的应用。面向对象技术用对象(实体属性和操作的封 装)、对象类结构(分类和组装结构)、对象间的通讯来描述客观世界,为描述复杂的三维空间提供了一条 结构化的途径;基于图标( Icon)的用户建模界面。建模过程中的对象和空间分析操作均以图标形式展示 给用户,用户亦可以自定义图标。用户对图标的定义、选择和操作中完成模型的定义和检验。这种方法较 之 AML 这类宏语言要方便和直观得多; GIS 与其他的模型和知识库的结合,这是许多应用领域面临的一个 非常实际的问题,即存在 GIS 之外的模型和知识库如何与 GIS 耦合成一个有机整体。 4)三维地理信息系统的研究 三维 GIS 是许多应用领域对 GIS 的基本要求。目前的 GIS 大多数提供了一些较为简单的三维显示和操 作功能,但这与真三维表示和分析还有很大差距。真正的三维 GIS 必须支持真三维的矢量和栅格数据模型 及以此为基础的三维空间数据库,解决了三维空间操作和分析问题。主要研究的方向包括:三维数据结构 的研究,主要包括数据的有效存储、数据状态的表示和数据的可视化;三维数据的生成和管理;地理数据 的三维显示,主要包括三维数据的操作,表面处理,栅格图像、全息图像显示,层次处理等。 6. 2. 2 实用地理信息系统发展趋势与展望 随着计算机和信息技术的发展, GIS 迅速地变化着。在未来 10 年内的 GIS 发展用下面几个方面来概 括。 1) GIS 网络化 对于 GIS 的发展,计算机网络技术是起到质变作用的重要技术。它的发展使得以往很多难以完成的事 情得以实现,如网络技术使得数据库在地理位置上以分布的方式存在,这样做,各个数据库可以局部地进 行生产、更新、维护和管理,而网络又使这些分布在局部的数据库相互之间可以连接起来实现共享使用。 高速度的数据传输使得数据库之间的数据传输能够快速地实现。万维网的发展给 GIS 数据在更大范围内的 发布、出版、获取和查询提供了有效可行的途径。网络浏览器的使用从视觉上给提供和使用地理数据的人 们带来了方便。地理数据不仅可以按照地理位置、专题内容、生产机构、使用价格等进行搜索,甚至可以 直接在网上进行数据的各类空间操作,使用网络提供的各类模型进行模拟,直接产生新的数据结果,真正 地实现“网络就是计算机”这一新的概念模式。网络技术虽然发展速度惊人,但是在 GIS 应用方面还有一 定局限,主要表现为地理数据的传输:目前,对于 GIS 数据的网络传输仍然有一些局限,由于 GIS 的数据 通常容量较大,现在网络宽带的能力在中远距离的大量数据传输过程中,速度不够令人满意,这将会是网 络技术在 GIS 发展过程中的一个瓶颈问题; GIS 网络软件的开发:网络技术给 GIS 技术的发展带来了更多 潜力,但是到目前为止, GIS 软件工业界还没有充分地将这些潜力发挥出来,许多技术在 GIS 领域仍然处 于研究和试验阶段,达到商业化、实用化还有一定的距离;网络技术在 GIS 中的有效使用:技术的发展只 有在给人们带来利益时才有真正的价值。网络技术有巨大潜力,但是如何在 GIS 领域得到有效的使用,充 分、恰当地发挥出它的潜能仍然是需要人们探索的问题。 2) GIS 标准化 今后 5-10 年是 GIS 界的主要标准化制定时期。 GIS 发展到今天这样,能够在各种领域得到使用的盛况, 人们不断意识到软件、硬件、数据等要素进行必要的标准化才能实现更有效、广泛地对 GIS 的使用。GIS 的标准化将在国际、国家、省、市、县和机构范围内多层次地进行,其内容可能包括到 GIS 的各个组成部 分、各个操作过程、各种数据类型、软件硬件系统等。标准化的真正实现将使人们能在一个共同理解基础 上共享信息和资源。 3)数据商业化 在西方社会,计算机硬件设备的生命周期通常为 3-5 年,计算机软件的生命周期一般为 7-15 年,而地 理数据的生命周期则为几十年。地理数据的开发、更新和维护既费时又费力,在 GIS 界曾经有人统计过, GIS 硬件、软件和数据的造价比是 1: 10: 100,所以如何更有效地生产和维护地理数据将会是 GIS 未来面 临的主要挑战之一。 GIS 产生的主要目的之一是对于空间信息进行更好的管理和处理, GIS 空间分析功能 实际上是使用现有的数据来产生新的数据,所以数据是整个 GIS 的操作对象。没有数据,则谈不上信息系 统。如果数据问题能够解决,信息系统才有意义和价值,才能够真正运行。 4)系统专门化 目前, GIS 软件和系统还是被作为一个整体独立存在。许多软件提供全面的 GIS 功能可以在任何一种 需要 GIS 的部门使用,没有具体专业领域的限制;而从使用 GIS 机构的角度上看,很多机构只是需要 GIS 软件中的部分功能,而目前 GIS 软件设置使得用户在购买 GIS 系统时往往要求整个软件一起购买。首先, 从 GIS 用户方面考虑,GIS 可能不将作为一个独立的系统存在于机构内,而是作为机构整个管理和运作系 统的一个部分, GIS 的各种功能将融合在与专业领域更直接的系统之中。其次,从 GIS 的工业发展角度上 考虑,目前的 GIS 软件所提供的各种功能也将与各类专业软件系统融合起来,共同发展。软件的部件化是 这个趋势的前兆,也为 GIS 软件的专业化做了必要的准备。将来的各类应用系统中, GIS 可能将作为一个 必须的部分存在。 5) GIS 企业化 GIS 网络化的发展使得 GIS 在机构内部各部门之间更有效地进行通讯、交流和进行各种资源的共享。 企业和机构可以从更高的层次上对 GIS 在企业中的使用进行统筹安排和计划,这种方式被称为“企业化 GIS”。企业化 GIS 对技术和管理人员有更高的要求,需要企业不断地对人员进行技术和管理培训。 6) GIS 全球化 网络技术的发展使得世界空间缩小,使人们之间的关系更加紧密;世界经济的发展也在要求人们建立 一个更稳定、和谐的环境。在这个环境中 GIS 越来越成为一种有效的工具来帮助人们了解他们所生存和依 赖的自然条件状况和社会变化状况。目前世界各国都在积极地发展和使用 GIS、制定有关地理信息的政策、 开展国家的 GIS 项目,例如世界银行和其它的国际信贷组织都要求在它们资助的项目中使用 GIS 来辅助决 策。 GIS 的标准化对于它在国际范围内的推广和使用将起到促进作用,国际标准组织已经专门就地理空间 技术从各个方面进行标准化制定和实施。 7) GIS 大众化 GIS 不仅在国际舞台上已经越来越受到人们重视,甚至在人们日常生活中也潜移默化地改变着人们的 生活。以往人们需要使用地图来定向、定位和导航,而现在地图已经存储在数据库中;从一个地点到另一 个地点的最佳路线轻而易举地就可以使用 GIS 系统得到;到一个新地方,不需要再费力寻找餐馆、旅店、 娱乐中心、购物中心、银行、旅游景点等,GIS 就是最好的向导。 我们借 助于 外感 官 ( 我们 意识的 一种 性质 ) 表 象给 我们自 己外 面的 对象 , 这 些对象 毫无 例外 的 在空间 里面 。 这 些对 象的 形状、 大小、 以及 它们 相 互间的 关系 是在 空间 里被 规定的 或能 够在 空 间里被规定的。 空 间 不 是一个 从外 部经验得 来的 经验概 念。 因为为使 着某 种感觉 与我 以外的某 些东 西发生 关 系, 以及 同样 地为 着我 能 把那些 感觉 表象 为互 相在 外、 互相 靠近 , 从 而 不 只 是彼此 不同 , 并 且 是在不同的地方,这样就一定要以空间观念为前提。 康德 第二章 从现实世界到比特世界 导读:本章从空间认知的角度讲述了对现实世界进行抽象的过程。空间认知属于行为地理学的范 畴,它研究个体如何对现实世界进行认知,并在意识中编码的过程。在认识的基础上进行逐步抽 象,最后得到数字化的空间数据,这正是OpenGIS九层抽象模型前五层所描述的内容。最后是空 间数据库模型,进一步强调了该抽象过程。 本章的内容有助于加深对空间数据和空间信息的理解。 从现实 世界 到人 的概 念世 界, 再到 数字 世界 , 最 后 通过用 户改 造自 然的 活动 反馈到 现实 世界 , 这 中间 三个阶 段对 应着 地球 信息 科学的 三个 研究 领域 , 即 地理认 知模 型的 研究 、 地 理概念 计算 方法 的研 究以 及地 理信息与社会的研究。如图 2-1 所示。 地理概 念 形式表 达 地理时 空思考 地理信息科学三 个领域地理信息流 地理认 知模 型研 究 地理概 念计 算方 法研 究 地理信 息与 社会 研究 现实世 界 概念世 界 数字世 界( GIS ) 应用领 域 信息 服 务 与计算机 实现 图 2-1: 地理信息流与地理信息科学三个领域 1.对现实世界的地理认知 地理环 境是 复杂 多样 的 , 要正确 地认 识 、 掌 握 与 应 用这种 广泛 而复 杂的 信息 , 需 要进 行去 粗取 精 、 去 伪存真 的加 工, 这就 要求 对地理 环境 进行 科学 的认 识。 对 于 复 杂 对 象 的 认 识 是一个 从感 性认 识到 理性 认识 的一个 抽象 过程 。 对 于 同 一客观 世界 , 不 同 社 会 部 门或学 科领 域的 人群 , 往 往在所 关心 的问 题 、 研 究 的 对 象等方面存在着差异,这就会产生不同的环境映象。 1. 1 认知的含义 认知属 于心 理学 的范 畴。 认知理 论早 在 70 年代 就 被引入 地图 学, 并用 “刺 激—— 反应 ”的 关系 模式 来研究 用图 者在 读图 时的 心理— —物 理反 应。 始于 90 年代 的地 图制 图可 视化 研究也 应用 了认 知概 念, 使 “刺激 —— 反应 ” 模 式的 研究向 纵深 推进 了一 步, 地图制 图可 视化 的实 质是 探讨地 图信 息传 输过 程中 人对 空间客 体的 认识 。根 据空 间信息 分析 以及 空间 信息 可视化 的需 要, 认知 应该 是知觉 、注 意、 表象 、记 忆 、 学习、思维、语言、概念形成、问题求解、情绪、个性差异等有机联系的信息处理过程。 在简单 的认 知系 统中 , 感 知系统 从外 界环 境输 入刺 激、 进行 变换 整合 , 提 取 刺激特 征加 以组 合 , 输 出 经 编码的物 理刺激 。长时记 忆系统将 输入的 经编码的 物理刺激 与系统 只能感知 的信息进 行比较 与模式匹 配, 一部 分信 息被激 活 , 这部分 被激 活的 信息 送入 短时记 忆系 统 。 短时 记忆 系统对 输入 的有 限信 息进 行精 细加工 , 通 过反 映系 统来 输出动 作、 语言 、 表 情等 。 中 枢 处 理 器 进 行 系 统 控 制和处 理, 决定 目标 先后 次序 和监督当前目标执行,图 2-2 描述了空间认知的框架。 图 2-2:空间认知 空间认知 地理学 家和 心理 学家 对空 间进行 了大 量研 究, 得到 了许多 有趣 的结 论, 它们 成为行 为地 理学 中研 究人 的空间 决策 的基 础 ; 在 GIS 中研 究空 间认 知 , 可 以 指 导建立 更加 符合 人类 思维 的空间 模型 和信 息表 现方 式。 下面介绍的是与空间认知有关的知识。 1)个体的空间认识的形成和发展 J.Piaget 认为 ,空 间认 识具 有四个 层次 :感 觉运 动( Sensorimotor)的层次 ,它 以行动 的表 象为 依据 ; 前运 算期 ( Pre-operational) 的 层 次 , 其 基 础 是 从记忆 中获 得的 有关 客观 世界的 知觉 的映 象; 形象 运算 ( Concrete Operational) 的 层次 , 其 中允 许符 号化 、 系 统化的 环境 心理 表象 ; 形 式运算 ( Formal Operational) 的层次 , 在 该层 次中 , 个 体具有 假设 —— 演绎 推理 能力, 能够 处理 独立 于行 动、 客 体 、 空 间 的 抽 象 的 空 间 概念。图 2-3 表示了个体成长过程中的空间认识的发展。 感觉运动期 感觉运动空间 映象的形成 客体的稳定性 前运算期 具体运算期 形式运算期 前运算空间 具体运算空间 形式运算空间 拓扑 空间 投影 空 间 欧式空 间 或 度 量 空 间 欧式空间参照系 参照系和欧式度量 标准的调整 看法的调整 以自 我 为 中 心 的 方 位 固定 的 参 照 系 坐标 参照系 青年以及 以上期 少年期 学前期 幼儿期 图 2-3:空间意识的个体发育 2)意识中的空间信息编码 [Elisabeth S. Nelson] 关于个体意识中的空间信 息的编码方式,主要有三 种理论:命题理论( Propositional Theory),图像 理论( Imagery Theory)和双重编码理论( Dual-coding Theory)。 ( 2. 1)命题理论 一个命 题 , 是 表 达 了 对 象 之间关 系的 概念 结构 。 命 题必须 符合 以下 规则 : 它 必须是 抽象 的 ; 它 必 须 与 一个真 值关 联 ; 它 必 须 符 合一定 的形 式化 规则 。 按 照命题 理论 , 空 间 编 码 形 如以下 的单 句 “ 俄 克 拉 荷 马 在 德克萨斯以北”,命题理论的关键是认为其命题只是对抽象的意义编码,而非信息的自然特征。 ( 2. 2)图像理论 图 像 理 论 认为, 在空 间认知 中, 图像 是其 关键 构成。 其理 论的 基础 是一 个图片 的 隐喻, 认为 个体 感知 并 处 理 空 间 信 息 , 然 后将其 组 织 成 为 简 单的、 更加有 序 的 形 式 。 这 些信 息被记 忆, 并且 可以 在需 要时重 新 编排生成图像。 ( 2. 3)双重编码理论 双重编 码理 论认 为语 言的 和视觉 的信 息被 独立 的处 理, 但 是 相 关 的 处 理 系 统 相互连 接。 一个 图像 系统 组织各 种简 单的 图像 , 形 成层次 结构 并且 可以 输出 为空间 的形 式 ; 而 语 言 系 统并行 地处 理各 种非 视觉 信息, 并组织成为更高层次的、连续的结构。 地理信 息系 统就 是信 息加 工系统 , 即 输 入 信 息 , 进 行编码 , 存 储 记忆、 做出 决策、 输出结 果。 这 就 是 环境信 息流 在人 的大 脑中 的处理 过程 被地 理信 息系 统所模 拟和 复制 的原 因, 当然, 认知 的目 的在 于求 解问 题,即找到问题的解决方案。认知操作包括常规问题求解和创造性问题的求解。 1. 2 环境映象与模型 环境映 象可 以看 作是 被学 习到的 稳定 的思 维概 念, 它总结 了个 人对 环境 的认 识、 评价 和选 择能力 , 对 任何人 与环 境相 互作 用的 调查研 究来 说, 理解 大脑 处理使 用什 么样 的信 息就 显得至 关重 要。 人与 环境 相互 作用的关系见图 2-4 所示。 表现的 刺激 信息 表现条 件 输入控 制 基本生 理组 成 基本生 理构 造 文化特 征 现状 处理中 心 指定反 映 评价反 映 规定反 映 存储的 刺激 信息 环境 感应者 映象 图 2-4:人与环境的相互作用关系图 在环境 映象 研究 中, 如何 从个人 那里 提取 对大 尺度 环境有 意义 的信 息? 如何 展现该 信息 , 以 便使 个人 的认知 范围 和程 度明 朗化 ?如何 分析 这些 信息 ?最 为普遍 的方 法是 绘制 描述 环境要 素的 简图 , 通 过 描 述 环 境要素 的序 列、 要素 之间 的联系 和差 异、 映象 的类 型、 细 节 和 规 模 的 变 化 等 来提供 信息 , 即 构造 模型 。 在 科学研 究中 , 经 常用 模型 作为实 际对 象的 代替 物或 模拟物 , 它 们与 被研 究的 对象之 间存 在某 种程 度的 一致 或相似 的映 射关 系: 借助 模型所 获得 的结 论和 推论 又可转 用于 实际 对象 上。 地理学 中所 采用 的表 现模 型多 种多样 , 例 如 各 种 地图、 航空和 航天 遥感 图像、 统 计图表 、 剖 面 图等, 但是 地图是 地学 中使 用最 普遍 、 也 是最重 要的模型。从 模型的特性 和实质来看, 地图是客观 世界的形象 /符号 /概括模型 。单幅地图是 模拟 客 观实际 的某 一方 面的 模型 , 而 系列 地图 和地图 集属 于高层 次的 模型 , 即 地理 系统的 模型 , 它们模 拟的 是 自 然要素 和社 会经 济要 素的 总体 , 反 映出 这些 要素 的 相互联 系 、 相 互 作 用 、 解 析特征 与综 合效 果 、 现 状 与 未 来发展趋势,以及它们所形成的复杂巨系统的功能特征等。 1. 3 地图认知模型 地图认知模型分为地图编制与设计者的认知模型和地图使用者的认知模型(图 2-5 和图 2-6) 。 思维 客观现 实世 界 感知系 统 制图综 合与 内容 选取信息处 理系 统 信息表 达系 统 地图客 观世 界 抽象 图 2-5:地图编制者的认识模型 地图所 表达 的客 观世 界 地图使 用者 的知 识背 景 形象思 维与 再现综合与 分析 被认识 的客 观世 界 感知系 统 图 2-6:地图使用者的认识模型 制图者 的认 知模 型强 调对 所表达 事物 和现 象的 认知 , 以 及 对 表 达 内 容 的 表 现 形式的 认知 。 制 图者 认知 的目的是指导制图者选取最主要的制图内容与最适合的表现形式,以高效地传输空间信息(图 2-7) 。 地图使 用者 的认 知是 在已 有地图 的基 础上 , 结 合读 图者的 自身 的空 间知 识与 背景, 完成 对地 图对 象的 认知,从而间接达到认知客观世界的目的。 图 2-7:制图活动过程 1. 4 地理客体的科学认知 地理认 知是 地理 信息 传输 过程中 一个 子系 统。 它偏 重于心 理感 知和 分析 , 认 知者既 感知 图上 明显 的信 息 也 挖 掘 潜 在 的 信 息 , 不 仅 仅 是 探 测 、 识 别或 区分信 息, 更要 主动 地解 译信息 , 形 成对 客观 世界 的整体 认 识。 从地 图学 者在编 制地 图时的 地理 认知 , 到 用图 者在读 图时 的地 理认 知, 这整个 过程 反映 了人 对地 理 课 题的认 识由 浅入 深的 特点 。 因 为 从 原 始 制 图 资 料 到 地图再 到新 地图 的地 理信 息传输 过程 , 正 是人 们对 地理 事物的认知深度的螺旋式上升过程。地理认知不仅是地理模型的基础,而且也是制图概括的基础。 在地理 认知 的基 础上 对真 实世界 的信 息进 行抽 象和 概括, 形成 地理 信息 系统 中的模 型, 在一 定比 例尺 下显示 地理 要素 的分 类、 分级和 空间 图形 格局 。地 图模型 本身 就是 一个 主观 与客观 相统 一的 过程 , GIS 专 家在地 理认 知中 不仅 全面 、 综 合 地 分 析 和 理 解 地 理 环境, 而且 其认 知中 还包 括了对 一些 客观 的模 拟标 准和 规范的接受或认同。 此外, 地理 认知 贯穿 于制 图概括 的整 个过 程。 具体 来看, 它表 现在 地图 设计 阶段, 对制 图概 括原 则、 内容、 分类分 级指 标的 “ 构思” 上, 以 地理认 知中 所获得 的关 于地 理环 境的 系统功 能、 层 次 结 构 、 各 个 要 素的组 合关 系等 的知 识为 指导。 在地 图编 绘阶 段, 对地图 要素 的选 取、 数量 和质量 概括 、 图 形简 化等 “构 图” 操作 上, 在处 理符 合 概括指 标的 要素 或图 形时 能够进 一步 体会 地理 认知 的控制 和指 导作 用, 做到 心中 有数,操作正确,不至于误解概括指标和规则。 1. 5 地图是客观世界的形象——符号——概括模型 1. 5. 1 地图是客观世界的形象模型 地图与 其它 地学 模型 的主 要区别 和优 点在 于它 具有 形象性 ,能 对实 际对 象做 出完整 的、 清晰 的和 直观 的图形描述和说明。 “地图是地表空间关系和空间形式的视觉图解表象” 。 1. 5. 2 地图是客观世界的符号模型 地图区 别于 其它 许多 图示 模型的 又一 特征 是它 采用 专门设 计和 事先 规定 的符 号来反 映地 物、 现象 和地 理 过 程 , 并 表示 它们 的位置 、 质 量特 征和 数量 特征。 各种 符号 的组 合便 构成一 种 地 图 形象, 而多 种地图 形 象的汇 集便 组成 一幅 完整 的地图 图形 。 地图符 号的 作用并 不仅 仅局 限于 传输 信息 , 它 们还 是记录 知识 、 使 知识定型并系统化的强大工具。 1. 5. 3 地图是客观世界的概括模型 地图不 是客 观对 象的 完全 再现 , 而 是通 过地图 制图 工作者 脑和 手的 “过 滤” 、 概括和 抽象 出来 的模 型。 对地物 进行 取舍 、 图 形化 简、 数 量 和 质 量 概 括 、 地 物协调 , 以 及夸 大表 示等 处理, 是地 图学 者对 地物 进行 深刻理 解 、 综 合分析 并抽 象概括 等一 系列 复杂 的科 学思维 和创 造性 劳动 的结 果。 因此 , 对 制图 对象 进 行 地 图概括是地图作为客观实际模型的一个最重要的特征。 2.现实世界的抽象 对地理 对象 的抽 象过 程通 常认为 有 9 个层 次 [OGC],在这 九个 层次 之间 通过 8 个接口 与它 们连 接, 定 义了从现 实世界到 地理要 素集合世 界的转换 模型。 这 9 个层 次依次 为现实 世 界 ( Real World) 、概 念世 界 ( Conceptual World) 、 地 理 空间世 界 ( Geospatial World) 、尺 度 世 界( Dimensional World) 、项 目 世 界( Project World) 、点 世界 ( Points World) 、几 何体 世界 ( Geometry World) 、地理 要素世 界( Feature World)以及 要 素集合 世界 ( Feature Collection World) (图 2-8) 。 连 接它们 的 8 个接 口分 别为 认识 ( Epistemic)接 口 、 GIS 学科 ( GIS Discipline)接口 、局 部测 度( Local Metric) 接口、 信息 团体( Community)接口、空 间参 照 系 ( Spatial Reference) 接 口 、 几 何 体 结 构 接 口 、 要 素 结构接 口及 项目 结构 接口 。 其 中前 五个 模型是 对现 实世 界的抽 象 , 并 不在计 算机 软件中 被实 现 ; 后四 个模 型是关 于真 实世 界的 数学 的和符 号化 的模 型, 将在 软 件 中被实现 * 。 维 度世界:度 量语言 项目世界: 信息团体 地 理空间世 界:G IS语言 概 念世界:自 然语言 现 实世界:基 本语言 要素集合 世 界:要素集合 要 素世界:要 素 几何世界: WKT 点 世界:坐标 几何 图 2-8: OpenGIS 的九层模型 * 因为九层模型后面四个层次与软件实现有关, 涉及具体的数据结构, 本章不做介绍, 可 以参照 “空间数据模型” 和 “ 空间 数据管理”两章的内容。本章只是介绍前五个模型——对现实世界进行抽象,得到数字化的、 GIS可以管理的模型。 2. 1 现实世界 现实世界是所有事物( Fact)的集合,无论人们是否 知道这些事物。根据事物 的本质,人们可以认 识 理解现 实世 界中 的事 物。 图 2-9 表 示 了 人 类 生 活 于 其中的 现实 世界 。象 云一 样的纹 理结 构占 据了 图形 的绝 大部分 ,代 表了 人们 所不 了解的 事物 ,而 且它 们造 成了宇 宙的 混沌 状态 。人 们只知 道一 些所 熟悉 的事 实 , 其中的一些被绘制在图中。 图 2-9:现实世界 2. 2 概念世界 概念世 界是 人类 自然 语言 的世界 , 人 类 了解且 认识 其所命 名的 事物 , 因 此这 些事物 构成 了 “语言 的 世 界” 。在图 2-10 的 概 念 世 界中, 表示 宇宙 混沌 状态 的云并 不存 在, 因为 这些 在自然 语言 内容 中通 常是 不可 见 的。示意 图显 示了 容易识 别 的 事 物 : 门 、 路 、 砖、屋顶 、 房 屋等 。 用 这种方 法,可以 返回 到真 实的世 界 中, 抽象 出一 个事 实的 本 质 , 称 之 为 精 髓 (Pith)。 由 于可以 给出 所知 道的 事物 的名字 , 而 且 能 够 感 受 到 这 些 相同的已知事物的本质,所以称真实世界与概念世界之间的交互为认识接口( Epistemic Interface) 。 图 2-10:概念世界 对于 GIS 来讲 , 自 然 语 言 的概念 世界 并不 是充 分抽 象的 , 在 GIS 中 只 有 概 念 世界中 一个 简化 的子 集才 是兴趣所在。这个子集叫做地理空间世界,人们与概念世界的交互的方法叫选择。 图 2-11 中, 有三 种实 体类 型。 每 个 由 一 个 矩 形 表 示 , 并且 每个 用其 上部 的名 字所表 示。 矩形 之间 的线 代 表着实 体之间 的联 系,每 条线在 末端带 有一 个作用 名以解 释这种 联系 。菱形 代表聚 合( Aggregation) , 例如 , 概 念世 界的存 在依 赖于真 实世 界的 存在 。 实 心圆意 味着 在联 系的 那个 末端存 在着 一个 集合 (并 不 是 一个单个的对象) ,例如,每个概念世界嵌入( Embed)一系列不同的地理空间世界。 现实世 界 地理空 间世 界概念世 界 精髓 名字 嵌入 选择 图 2-11:现实世界与地理空间世界的联系 2. 3 地理空间世界( Geospatial World) 从事 GIS 的技 术人 员都 习 惯于把 世界 看作 一个 抽象 的、 几乎 是具 有卡 通特 性 的世界 。 这 是 由 于 在 概 念 层次的 世界 充满 了复 杂的 形状、 样式 、 细 节。 这 些 复杂性 在地 理空 间世 界中 被消除 , 并 用简 单的 、 浅 显的 抽象来 代替 ,这 些抽 象通 常在时 间以 及空 间上 都是 静态的 。通 过地 理空 间世 界的抽 象, 河流 是被 看作 线 , 地形被看作等高线多边形的简化,而森林被看作多边形。 前面描 述的 概念 世界 在 图 2-12 中以卡 通的 方式 在地 理空间 世界 水平 上被 重画 。图 2-12 是以 透视 的方 式绘制 的, 但 是 地 理 空 间 世界通 常是 从一 个 “ 顶 点 ” 来观 察, 即 垂直地 从上 向下看 。 注 意 在 图 中 , 一 些特 征已经 消失, 另外 一些 已 经变得 大大 简化。 例如, 一些窗 户、 墙 、 建筑 物的 房顶已 经消 失。 这 是 由 于 它 们 并不 是 GIS 世界 视点 的兴趣 所 在 。 它 们已 经成为 GIS 意识 中所 不可 见的。 当 然 , 并 不存在 一个 通用 的 定 义 ——准 确地 讲 , 什 么 样 的 特征对 于一 个 GIS 技术 人 员来讲 是其 兴趣 所在 , 也 许有时 一个 屋顶 可能 会引 起兴 趣 。卡通仅 仅表明 地理空间 世界是概 念世界 中的一个 子集和一 个简化 ,在地理 空间世界 中所讲 的语言是 GIS 学科 语言 。在 图中 , 房屋的 地基 还保 持着 ,尽 管在概 念世 界中 ,部 分地 基被隐 藏在 其它 要素 后面 。从 GIS 的观 点来 看, 一个 建 筑物的 所有 的地 基都 是可 见的— —尽 管有 些是 看不 见的 。 每 个 GIS 实现 都有 特定 的规则 ,这 些规 则规 定了 在地理 空间 世界 中什 么样 的特征 被识 别以 及它 们是 如何从 概念 世界 中被 简化 的 。 例如, 一个 规则 可以 把一 个砖房 简化 为一 个三 维的 多面体 ; 然 而具 有另 一种 表面物 质的 一个 房屋 被简 化为 它的地 基多 边形 。 简 单地 讲, 在概 念世 界中不 可见 的事物 在地 理空 间世 界中 就变得 可见 了 , 因为 这些 事 物 在 GIS 中是 特殊 兴趣 所在。 概念 世界 和地 理空 间世界 之 间 的 交 互 称 为 GIS 学科 接 口 ; 从 概念 空间 进行的 交 互方法叫 做选 择。为 了转 换从地理 空间 到概念 世界 的这种交 互, 人们可 以采 用嵌入( Embed)方 法, 这种 方法把 GIS 感兴趣的内容放置在概念世界适当的语境( Context)中。 在地理 空间 世界 中所 认识 的要素 通常 有一 个自 然的 维度: 0、 1、 2 或者 3, 这取决 于它 们是 否被 看成 点 、线、面 、体。此 外,根 据二元拓 扑关系( 如包含 、相邻或 分开) ,它们 还具 有另外的 量度。下 一个层 次的抽 象识 别了 要素 固有 的维度 和尺 度 ( Dimensionality and Metrics) 特性, 因 此叫做 维度 世界 , 可 以通 过 在欧氏空间中进行工具测量获取要素的尺度。 图 2-12:地理空间世界 2. 4 维度世界( Dimensionality World) 维度世 界是 地理 空间 世界 的一个 抽象 , 其中包 括一 些测量 工具 , 如卷尺 测量 和指南 针 , 在 这样的 水 平 上所认 识到 的事 实包 括一 元 ( Unary) 关 系 ( 如一 个 弧段的 长度 ) 和 二 元 ( Binary) 关 系 ( 如两 点之 间的 距 离) ,这些关系本身就是各种要素的抽象。 维 度世界 与地理空 间世界的 接口叫 做适合( Fit) 。两 个电话 线路杆之 间的距离 是属于 维度世界 。这 个 长度线适合于地理空间世界中所见到的长度跨度,在图 2-13 中包括了在维度空间所表现的一些抽象。 维度世 界是 现实 世界 抽象 的最后 一个 。 下 一个 抽象 叫做一 个项 目世 界, 该世 界只发 生在 一个 具体 的实 现中 , 每 一个 实现 都是 针 对一个 特殊 的 GIS 学 科或分 学 科 。 在 每一 个实 际的实 现 中 , 只 有维 度世 界中的 一 个子集得到识别。通常这个子集是由研究区域的范围和被测量的特定的现象所决定的。 在项目 世界 的层 次中 , 空 间参照 系统 ( Spatial Reference System) 的 概 念 被 引入, 最常 见的 参照 系统 是 环 绕地球表 面建立的 坐标系 统(经纬 度) ; 此外, 还有 其它的间 接的参照 系统, 例如线性 参照系统 可以用 一 个 参 数 标 识 出 一 条 线 ( 如 高 速 公 路 ) 上 的一 个点位 。 无 论采 用哪 种坐 标参照 系 统 , 都 可以 确定 维度世 界 中的要 素的 每个 “ 角 点 ” 的坐标 。 维 度 世 界 和 项 目 世界之 间的 接口 称为 信息 团体接 口 , 从 维 度 世 界 调 用 该 接口的 方法 叫做 编码 ( Codify) , 其结果是 每个 “ 角 点 ” 的坐 标以 一组 数值 表示 ; 相 反 的 , 从 项目 世界 调 用 的方法称为定位,它确定了每个要素与其他要素的相对关系。 图 2-13:维度世界 2. 5 项目世界( Project World) 有两种 常用 的方 法来 对地 理空间 要素 建模 。 第 一个 模型定 义了 点、 线、 多 边 形 的一个 要素 的空 间范 围, 以及来自于所 熟知的一系列类型的几何 基本单元( Primitive) ,在这种方式下的要素叫做“ 几何体要素 ( Features with Geometry) ” 。 第二种 称为 覆盖 ( Coverage) , 影 像 是 该 模 型 的 一 个 特殊的 例子 。 几 何 体 要 素 和覆盖 是紧 密相 关的, 但 是在概念上截然不同 * 。 要素模 型用 于对 现实 世界 中的地 物对 象建 模, 如道 路、城 市等 等; 而覆 盖模 型则对 现象 建模 ,包 括 : 温度、 土壤分 布等 等。 一 个要素 具有 多种 属性, 如 空间位 置属 性, 空 间 关 系 属性, 描述属 性, 时 间 属 性 等 等,覆盖也可以视为要素的一种属性。 GIS 并不 只是 一个 学科 , 它还是 地理 空间 信息 表现 的一门 语言 ,其 中这 些信 息源于 许多 与地 理学 科相 关的学 科, 如森 林管 理、 土壤制 图、 运输 模型、 地 籍管理 等等 , 这 些学 科中 的每一 门学 科都 有许 多子 学科, 一个 GIS 项目可以包含任何这些学科的组合。 * “空间数据模型”一章中描述的“要素模型”和“场模型”对应于这两种技术。 正是项 目世 界语 言的 多样 性导致 了 GIS 信息 存储 之 间相交 互的 最复 杂的 问题 。 这 是人 为造 成地 理空 间 世界分割的原因。但是,如果对语言结构进行充分地统一化,这种情况是可以管理的。 地理信 息团 体是 指共 享数 据的用 户群 ,他 们属 于不 同的专 业领 域, 可以 是数 据使用 者, 也可 以是 数据 提供者 。地 理信 息团 体将 整个地 理空 间世 界中 的一 个特殊 的子 集看 成是 一个 抽象。 在三 个不 同的 应用 中 , 上述的 例子 被抽 象为 三个 不同的 项目 世界 模型 。 它 们显示 在 图 2-14 中, 分别 反映了 一个 制图 员、 一个 地籍 管理人员和一个道路管理人员视角的项目世界。 图 2-14:项目世界 3.比特世界 3. 1 比特世界 地理信息系统以数字世界表示自然世界,现实世界与数学模型之间的关系见图 2-15。 在计算 机中 , 现 实世 界是 以各种 符号 形式 来表 达和 记录的 , 计 算机 在对 数字 和符号 这些 符号 进行 操作 时 ,又将它 们表示为 二进制 形式(比 特世界 ) 。因 此, 基于计算 机的地理 信息系 统不能直 接作用于 现实世 界, 必须 经过 对现实 世界 的数据 描述 这一 步骤 。 模 型是对 现实 世界 的简 化表 达, 是将 系统 的各个 要素 通 过 适当的筛选,用一定的表现规则描写出来的简明的映象。 现实世 界的 信息 数学的分析 、 预 报、决 策或 控 制 现 实 世界 的分 析、预报、 决 策 数学模 型 翻译、 归纳 解译 检验 演绎 推断 图 2-15:现实世界与数学模型的关系 一幅地 图是 一个 符号 模型 , 因 为 它 是 通 过 制 图 学 家 处理后 得到 现实 世界 的简 化描述 ; 存 储数 字地 图的 计算机文件也是一种符号模型,它以数字代码来表现图形符号。一幅数字地图的产生不仅需要选择所要表 现的物体,还要进一步考虑如何对表达它们的数据进行组织。如果数据的组织规则没有很好地建立起来, 则一幅数字地图除了对生产这些数据的个人或组织有用以外,对于其他人是没有用的。 数据是对现实世界状况的数字符号记录,信息是经过重新组织的,能揭示现实世界内在机理的并有利 于研究工作的数据。如果数据不以空间属性表来组织,则很难从空间数据中抽取出空间信息。由于计算机 的数字化特征,数据项必须是离散的以便于进行数字处理和操作,因此,地理空间也必须离散化的表达。 数据建模是指把现实世界的数据组织为有用且能反映真实信息的数据集的过程。根据一定的方案建立的数 据逻辑组织方式叫数据模型。数据建模过程分为三个步骤:首先,选择一种数据模型来对现实世界的数据 进行组织;然后,选择一种数据结构来表达该数据模型;最后,选择一种适合于记录该数据结构的文件格 式。可见,一种空间数据建模可能有几种可选的数据模型,而每一种数据结构又可能有多种文件格式进行 存储。空间数据可依据它们的采集方式、存储方法、使用目标等,用不同的数据模型进行组织。如GIS中 最常用的数据组织方式为矢量模型和栅格模型。在矢量模型中,用点、线、面表达世界,在栅格模型中用 空间单元或像元来表达世界。 3. 2 模型的作用 在地理信息系统中,模型,尤其是数学模型起着十分重要的作用。由于模型是对客观世界中解决各种 实际问题所依据的规律或过程的抽象或模拟,因此能有效地帮助人们从各种因素之间找出其因果关系或者 联系,有利于问题的解决。模型的建立是数学或技术性的问题,但它必须以广泛、深入的专业研究为基础, 专业研究的深入程度决定了所建模型的质量与效果,而模型的质量和数量又决定了系统中数据使用的效率 和深度。大量模型的发展和应用,实际上集中和验证了该应用领域中许多专家的经验和知识,这无疑成为 一般地理信息系统向专家系统发展的基础。 3. 3 GIS 空间数据建模 GIS 是专门用于采集、存储、管理、分析和表达空间数据的信息系统,它既是表示、模拟现实空间世 界和进行空间数据处理分析的工具,也是一门关于空间信息处理分析的科学技术。就 GIS 的工具特性而言, 它是为人们采用数字形式表示和分析现实空间世界提供了一系列空间操作和分析的功能,包括综合地存储 管理人们研究和解决空间问题所需的各种空间数据;根据用户的要求查询有关的空间分布信息,进行各种 统计量算、列表制图;根据规划、管理、生产的需要,进行多因素的综合研究、决策方案的模拟优化等。 所以, GIS 一方面应为用户采用数字形式表示和分析空间现象或问题提供空间数据建模及分析操作的手段, 另一方面应向用户提供友好的使用界面,便于用户进行空间数据建模、查询、分析等。 空间数据建模的基本任务是,针对所研究的空间现象或问题,描述 GIS 的空间数据组织,设计 GIS 空 间数据库模式,这包括定义空间实体及其相互间关系,确定数据实体或目标及其关系,设计在计算机中的 物理组织、存储路径和数据库结构等。这项工作是以空间数据模型的理论为指导的。空间数据模型是关于 现实世界中空间实体及其相互间联系的概念,为描述空间数据组织和设计空间数据库模式提供了基本的方 法。 一般而言, GIS 空间数据模型由概念数据模型、逻辑数据模型和物理数据模型三个有机联系的层次所 组成。其中概念数据模型是关于实体及实体间联系的抽象概念集,逻辑数据模型是表达概念数据模型中数 据实体(或记录)及其间关系,而物理数据模型则是描述数据在计算机中的物理组织、存储路径和数据库 结构,三者之间的相互关系如图 2-16 所示。 外模式 物理数 据模 型 逻辑数 据模 型 空间概 念数 据模 型 外模式 外模式 现实空 间世 界 图 2-16:空间数据模型的三个层次 3. 4 GIS 空间数据模型的概念与分类 3. 4. 1GIS 空间概念数据模型 由 于 职业、 专业 等的 不同, 人们 所关 心的 问题 、 研 究 对 象 、 期 望的 结果 等方面 存 在 着 差异, 因而 对现 实世界 的描 述和 抽象 也是 不同的 ,形 成了 不同 的用 户视图 ,称 之为 外模 式。 GIS 空间 数据 模型 的概 念 模 型 是考虑 用户 需求 的共 性, 用统一 的语 言描 述和 综合 、 集 成各 用户 视图 。 目 前 广为采 用的 数据 模型 是基 于平 面图的矢量数据模型和基于连续铺盖的栅格数据模型。 3. 4. 2 空间逻辑数据模型 逻 辑数据模 型是根据 前述的 概念数据 模型确定 的空间 数据库信 息内容( 空间实 体及相互 关系) ,具体 地 表 达 数 据项、 记录 等之间 的 关系, 因而 可以 有若干 不 同 的 实 现 方法。 一般来 说, 可将 空间 逻辑 数据模 型 分为采用结构化模型和面向操作的模型两大类。 1)结构化逻辑数据模型 结构化 模型 是显 式表 达数 据实体 之间 关系 的树 形结 构。 其中 的层 次数 据模 型 是按树 型结 构组 织数 据记 录, 以反 映数 据之间 的隶 属或层 次关 系 。 网络 数据 模型是 层次 数据 模型 的一 种广义 形式 , 是若干 层次 结 构 的并 , 其 优点 是能 反映 现 实世界 中极 为常 见的 多对 多的联 系 , 缺 点 是 复 杂 。 一般而 言 , 结 构 化 模 型 能 直 接 地反映现实世界中空间实体之间的联系。 2)面向操作的逻辑数据模型 关系数 据模 型是 用二 维表 格表达 数据 实体 之间 的关 系,用 关系 操作 提取 或查 询数据 实体 之间 的关 系 , 因此称 之为 面向 操作 的逻 辑数据 模型 。 其优点 是灵 活简单 , 但 表 示复杂 关系 时比其 它数 据模 型困 难; 当 数 据构成 多层 联系 时, 存储 空间利 用效 率较 低。 当前 的一种 发展 趋势 是将 两者 的优点 集中 起来 , 形 成新 的 或 改进的逻辑数据模型,如扩展的网络模型。 3. 4. 3 物理数据模型 逻辑数据模型并不涉及最底层的物理实现细节,但计算机处理的是二进制数据,必须将逻辑数据模型 转换为物理数据模型,即要设计空间数据的物理组织、空间存取方法、数据库总体存储结构等。 1)物理表示与组织 层次逻辑数据模型的物理表示方法主要有物理邻接法、表结构法、目录法。网络数据模型的物理表示 方法主要有变长指针表、位图法、目录法等。关系数据模型的物理表示是用关系表进行的。物理组织主要 是考虑如何在外存储器上以最优的形式存放数据,通常要考虑操作效率、响应时间、空间利用和总的开销。 2)空间数据存取 数据库的“存”是指从内存写一块到外存,“取”指从外存写一段到内存。常用的存取方法有: 第一种,文件结构法:包括顺序结构(如二分查找,插值查找)、表结构(线性表,倒排表)和随机 结构。 第二种,索引文件:它是提高数据存取效率的基本方法。对索引的插入、删除等只涉及到索引记录本 身,而对数据记录的操作要看具体的数据组织策略。如果索引本身很大的话,就要对索引文件再索引,建 立多级索引,如 B 树、 B+树等。 B 树是基于主关键字的索引,若要根据次关键字进行索引,必须建立倒排 索引表。但是,如果这种基于次关键字的搜索是主要操作的话,这类索引就不适合了。 第三种,点索引结构:由于 B 树在进行基于次关键字的搜索时是不适合的,为此,将空间定位数据及 其属性看作是多维空间中的点,采用栅格索引、KD 树、四叉树、 R 树等多维点索引结构进行索引。目前 空间存取方法及查询优化仍是 GIS 研究中的一个重要的课题。 藿乐威尔田园的真正迷人之处,在我看是:它的遁隐之深,离开村子有两英里, 离开最近的邻居有半英里,并且有一大片地把它和公路隔开了;它傍着河流,据 它的主人说,由于这条河,而升起了雾,春天就不会下霜了。 梭罗 在地球表面的任何地方都存在着垂直的和水平的两种关系: 垂直关系把同一个地 方的不同要素联结起来,而水平关系则把不同地方的各种因素联结起来。这两种 关系的相对重要性随时代的变化而有所不同… 正是这双重的关注,甚而至于这两 种关系的结合,才为地理学提供了独特性和完整性。 R.J.约翰斯顿 第三章 空间数据模型 导读:本章描述的是整个GIS理论中最为核心的内容。为了能够利用信息系统工具 来描述现实世界,并解决其中的问题,必须对现实世界进行建模。对于地理信息系 统而言,其结果就是空间数据模型。空间数据模型可以分为三种: 场模型:用于描述空间中连续分布的现象; 要素模型:用于描述各种空间地物; 网络模型:可以模拟现实世界中的各种网络; 在各种模型中,又介绍了相关的概念,如空间划分,空间关系,以及拓扑关系的形 式化描述——9交模型等。 最后讲述了普通的二维数据模型在空间上和时间上的扩展,时间数据模型和三维数 据模型。 值得注意的是,本章谈到的场模型和要素模型类同于后面提及的栅格数据和矢量数 据,但是前者是概念模型;后者是指其在信息系统中的实现。 1.空间数据模型的基本问题 人类生活和生产所在的现实世界是由事物或实体组成的,有着错综复杂的组成结构。从 系统的角度来看,空间事物或实体的运动状态(在特定时空中的性状和态势)和运动方式(运 动状态随时空变化而改变的式样和规律)不断发生变化,系统的诸多组成要素(实体)之间 又存在着相互作用、相互制约的依存关系,表现为人口、物质、能量、信息、价值的流动和 作用,反映出不同的空间现象和问题。为了控制和调节空间系统的物质流、能量流和人流等, 使之转移到期望的状态和方式,实现动态平衡和持续发展,人们开始考虑对其中诸组成要素 的空间状态、相互依存关系、变化过程、相互作用规律、反馈原理、调制机理等进行数字模 拟和动态分析,这在客观上为地理信息系统提供了良好的应用环境和重要发展动力。 1. 1 概念 地理数据也可以称为空间数据( Spatial Data)。地理空间是指物质、能量、信息的存在 形式在形态、结构过程、功能关系上的分布方式和格局及其在时间上的延续。地理信息系统 中的地理空间分为绝对空间和相对空间两种形式。绝对空间是具有属性描述的空间位置的集 合,它由一系列不同位置的空间坐标值组成;相对空间是具有空间属性特征的实体的集合, 由不同 实体 之间 的空 间关 系构成 。在 地理 信息 系统 应用中 ,空 间概 念贯 穿于 整个工 作对 象 、 工作过 程、 工作 结果 等各 个部分 。空 间数 据就 是以 不同的 方式 和来 源获 得的 数据, 如地 图 、 各种专题图、图像、统计数据等,这些数据都具有能够确定空间位置的特点。 空间数 据模 型是 关于 现实 世界中 空间 实体 及其 相互 间联系 的概 念, 它为 描述 空 间数据 的 组织和设计空 间数据库模 式提供着基本 方法。因此 ,对空间数据 模型的认识 和研究在设 计 GIS 空间数据库和发展新一代 GIS 系统的过程中起着举足轻重的作用(图 3-1) 。 图 3-1:概念数据模型 1. 2 空间数据模型的类型 在 GIS 中 与 空 间 信 息 有 关 的信息 模型 有三 个, 即基 于对象 (要 素) ( Feature)的模型 、 网络 ( Network)模 型以 及 场 ( Field)模型。 基于 对 象 ( 要 素 ) 的 模型强 调了 离散对 象, 根 据它们 的边 界线 以及 组成 它们或 者与 它们 相关 的其 它对象 , 可 以详 细地 描述 离散对 象。 网络 模型表 示了 特殊 对象 之间 的交互 , 如 水或 者交 通流。 场模型 表示 了在 二维 或者 三维空 间中 被 看作是连续变化的数据。 有很多 类型 的数 据, 有时 被看作 场, 有时 被看 作对 象。 选 择 某 一 种 模 型 而 不 选择另 外一 种模型 主要 是顾 及数 据的 测量方 式。 如果 数据 来源 于卫星 影像 , 其 中某 一现 象的一 个值 主要 是为区 域内 每一 个位 置提 供的, 如作 物类 型或 者森 林类型 可以 采用 一个 基于 场的观 点; 如果 数据是 以测 量区 域边 界线 的方式 而且 区域 内部 被看 成是一 致的 , 就可 以采 用一 个基于 要素 的 观点; 如果 是将 分类 空间 分成粗 略的 子类 , 一 个基 于场的 模型 可以 被转 换成 一个基 于要 素的 模型,因为后者更适合于离散面的或者线的特征的度量和分析。 1. 3 GIS 空间数据模型的学术前沿 时 空 数 据 模型、 三维 数据模 型、 动态 空间 数据 结构、 分布 式空 间数 据管 理、 空 间 存 取 方 法、 GIS 设计的 CASE 工具等是目前国际上 GIS 空间数据模型研究的学术前沿。 1. 3. 1 时空数据模型 时空数 据模 型的 核心 问题 是研究 如何 有效 地表 达、 记 录和管 理现 实世 界的 实体 及其相 互 关系随 时间 不断 发生 的变 化。 这种 时空 变化表 现为 三种可 能的 形式 , 一 是属 性变化 , 其 空 间 坐标或位置不变;二是空间坐标或位置变化,而属性不变,这里空间的坐标或位置变化既可 以是单一实体的位置、方向、尺寸、形状等发生变化,也可以是两个或两个以上的空间实体 之间的关系发生变化;三是空间实体或现象的坐标和属性都发生变化。当前时态 GIS 研究 的主要问题有:表达时空变化的数据模型、时空数据组织与存取方法、时空数据库的版本问 题、时空数据库的质量控制、时空数据的可视化问题等。 1. 3. 2 三维空间数据模型 国际上关于三维空间数据模型的研究大体上可分为两个方向:一是三维矢量模型,其是 用一些基元及其组合去表示三维空间目标,这些基元本身是可以用简单数学解析函数描述 的。二是体模型,以体元(Voxel )模型为代表,这种体元模型的特点是易于表达三维空间 属性的非均衡变化,其缺点是所占存储空间大、处理时间长。 1. 3. 3 分布式空间数据模型 分布式空间数据库管理系统和联邦空间数据库是国际上关于分布式空间数据模型的两 个主要研究方向。 1)分布式空间数据库管理系统 分布式空间数据库管理系统是将空间数据库技术与计算机网络技术相结合,利用计算机 网络对通过通讯线路相关联的空间数据库进行数据和程序的分布处理,以实现集中与分布的 统一,即分布式空间数据库管理系统是将分散的空间数据库连成一体。其主要问题包括空间 数据的分割、分布式查询、分布式并发控制。 2)联邦空间数据库(Federated Spatial Database ) 联邦空间数据库则是在不改变不同来源的各空间数据库管理系统的前提下,将非均质的 空间数据库系统联成一体,形成联邦式的空间数据库管理体系,并向用户提供统一的视图。 1. 3. 4 CASE工具 * CASE 工具是计算机信息系统结构化分析、数据流程描述、数据实体关系表达、数据字 典与系统原型生成、原代码生成的重要工具,在非空间型计算机信息系统的设计与建立中有 着较为广泛的应用。当前国际上的一个重要发展方向是,根据 GIS 空间数据建模的特点和 CASE 工具的原理,在现有 CASE 软件平台上,发展 GIS 空间数据建模与系统设计的专用功 能,这将有效地提高 GIS 空间数据建模及其应用系统设计的自动化程度和技术水平。 2.场模型 对于模拟具有一定空间内连续分布特点的现象来说,基于场的观点是合适的。例如,空 气中污染物的集中程度、地表的温度、土壤的湿度水平以及空气与水的流动速度和方向。根 据应用的不同, 场可以表现为二维或三维。 一个二维场就是在二维空间中任何已知的地点上, 都有一个表现这一现象的值;而一个三维场就是在三维空间中对于任何位置来说都有一个 值。一些现象,诸如空气污染物在空间中本质上讲是三维的,但是许多情况下可以由一个二 * 在“地理信息系统软件工程技术”一章较为详尽的描述了该领域的内容。 维场来表示。 场模型可以表示为如下的数学公式: z : sg224 z ( s ) 上式中,z 为可度量的函数,s 表示空间中的位置,因此该式表示了从空间域(甚至包 括时间坐标)到某个值域的映射。表 3-1 给出了地理研究中一些常模型的例子[A. Vckovski] 。 场模型 定义域维数 值域维数 自变量 因变量 T(z) 1 1 空间坐标(高程) 高度 z 处的气温 E(t) 1 3 时间坐标 某时刻的静电力 H(x,y) 2 1 空间坐标 地表高程 P(x,y,z) 3 1 空间坐标 土壤的孔隙度 v(λ,φ,z) 3 3 空间坐标(λ,φ经纬 度,z高度) 风速(三维矢量) σ(x,y,z) 3 9 空间坐标 压力张量 Θ(λ,φ,p,t ) 4 1 p 压力面,t 时间 潜温 Θ t (λ,φ,p ) 3 ∞ p 压力面 时间序列的潜温 I(x,y,z,t,λ ) 5 1 x,y,z,t时空坐标,λ 波长 波长λ的电磁波在 x,y,z,t处的辐射强度 2. 1 场的特征 场经常被视为由一系列等值线组成,一个等值线就是地面上所有具有相同属性值的点的 有序集合。 2. 1. 1 空间结构特征和属性域 在实际应用中,“空间”经常是指可以进行长度和角度测量的欧几里德空间。空间结构 可以是规则的或不规则的,但空间结构的分辨率和位置误差则十分重要,它们应当与空间结 构设计所支持的数据类型和分析相适应。属性域的数值可以包含以下几种类型:名称、序数、 间隔和比率。属性域的另一个特征是支持空值,如果值未知或不确定则赋予空值。 2. 1. 2 连续的、可微的、离散的 如果空间域函数连续的话,空间域也就是连续的,即随着空间位置的微小变化,其属性 值也将发生微小变化,不会出现像数字高程模型中的悬崖那样的突变值。只有在空间结构和 属性域中恰当地定义了“微小变化”,“连续”的意义才确切; 当空间结构是二维(或更多维)时,坡度——或者称为变化率——不仅取决于特殊的位 置,而且取决于位置所在区域的方向分布(图 3-2)。连续与可微分两个概念之间有逻辑关 系,每个可微函数一定是连续的,但连续函数不一定可微。 图 3-2:某点的坡度取决于位置所在区域的各方向上的可微性 如果空 间域 函数 是可 微分 的, 空 间 域 就 是 可 微 分的; 行政区 划的 边界 变化 是离 散的一 个 例子, 如果 目前 测得 的边 界位 于 A, 而 去 年 这 时边界 位于 B, 但 这并 不表 明 6 个月 前边 界将 位于 BA 之间的中心,边界具有不连续跃变。 2. 1. 3 与方向无关的和与方向有关的(各向同性和各向异性) 空间场 内部 的各 种性 质是 否随方 向的 变化 而发 生变 化, 是 空 间 场 的 一 个 重 要 特征。 如果 一个场 中的 所有 性质 都与 方向无 关, 则称 之为 各向 同性场 (Isotropic Field)。例如旅行 时间 , 假如从 某一 个点 旅行 到另 一个点 所耗 时间 只与 这两 点之间 的欧 氏几 何距 离成 正比 , 则从 一个 固定点 出发 , 旅 行一 定时 间所能 到达 的点 必然 是一 个等时 圆, 如图 3-3-(a)所 示 。 如果 某一 点 处有一条高速通道,则利用与不利用高速通道所产生的旅行时间是不同的,见 图 3-3-(b)。 等时线 已标 明在 图中 , 图 中的双 曲线 是利 用与 不利 用高速 通道 的分 界线 。 本 例中的 旅行 时间 与目标点与起点的方位有关,这个场称为各向异性场( Anisotropic Field) 。 (a) (b) 图 3-3:在各向同性与各向异性场中的旅行时间面 2. 1. 4 空间自相关 空间自 相关 是空 间场 中的 数值聚 集程 度的 一种 量度 。 距离近 的事 物之 间的 联系 性强于 距 离远的 事物 之间 的联 系性 。 如 果 一 个 空 间 场 中 的 类 似的数 值有 聚集 的倾 向, 则该空 间场 就表 现出很 强的 正空 间自 相关 ; 如 果 类 似 的 属 性 值 在 空 间上有 相互 排斥 的倾 向, 则表现 为负 空间 自相关( 图 3-4) 。因此空间自相关描述了某一位置上的属性值与相邻位置上的属性值之 间 的关系。 图 3-4:强空间正负自相关模式 2. 2 栅格数据模型 栅格数 据模 型是 基于 连续 铺盖的 , 它 是将 连续 空间 离散化 , 即 用二 维铺 盖或 划分覆 盖整 个连续空间;铺盖可以分为规则的和不规则 * 的,后 者可当做拓扑多边形处理,如社会经济 分区、 城市街 区; 铺 盖 的 特征参 数有 尺寸、 形状、 方位和 间距。 对同 一现 象 , 也可能 有若 干 不同尺 度、 不同 聚分 性( Aggregation or Subdivisions)的铺 盖。 在边 数 从 3 到 N的规 则铺 盖 ( Regular Tesselations)中 ,方格 、三 角形 和六 角形 是空间 数据 处理 中最 常用 的。三 角形 是 最基本 的不 可再 分的 单元 , 根 据 角 度 和 边 长 的 不 同 , 可以 取不 同的 形状 , 方 格、 三 角 形 和 六 角形可完整地铺满一个平面(图 3-5) 。 图 3-5:三角形、方格和六角形划分 基 于 栅 格 的 空 间 模型把 空间 看作 像元 ( Pixel)的 划分 ( Tessellation) ,每 个像元 都与 分 类或者 标识 所包 含的 现象 的一个 记录 有关 。像 元与 “栅格 ”两 者都 是来 自图 像处理 的内 容 , 其中单 个的 图像 可以 通过 扫描每 个栅 格产 生。 GIS 中 栅格数 据经 常是 来自 人工 和卫星 遥感 扫 描设备 中 , 以 及用于 数字 化文件 的设 备中 。 采 用栅 格模型 的信 息系 统, 通常 应用了 前面 所 述 的分层 的方 法。 在每 个图 层中栅 格像 元记 录了 特殊 的现象 的存 在。 每个 像元 的值表 明了 在已 知类中现象的分类情况(图 3-6) 。 * “空间分析”一章中提及的 Voronoi多边形和 TIN属于不规则铺盖。 图 3-6:栅格数据模型 由于像 元具 有固 定的 尺寸 和位置 , 所 以栅 格趋 向于 表现在 一个 “栅 格块” 中 的自然 及人 工现象 。 因 此分 类之 间的 界限被 迫采 用沿 着栅 格像 元的边 界线 。 一 个栅 格图 层中每 个像 元通 常被分 为一 个单 一的 类型 。 这 可 能 造 成 对 现 象 的 分 布的误 解, 其程 度则 取决 与所研 究的 相关 的像元 的大 小。 如果 像元 针对特 征而 言是 非常 小的 , 栅 格 可 以 是 一 个 来 表 现 自然现 象的 边界 随机分 布的 特别 有效 的方 式, 该现 象趋 于逐渐 地彼 此结合 , 而 不 是简单 地划 分。 如果 每个 像 元限定 为一 个类 , 栅 格模 型就不 能充 分地 表现 一些 自然现 象的 转换 属性 。 除 非抽样 被降 低到 一个微 观的 水平 , 否 则许 多数据 类事 实上 都是 混合 类。 模糊 的特 征通过 混合 像元 , 在 一个 栅 格内可 以被 有效 地表 达, 其中组 成分 类通 过像 元所 有组成 度量 的或 者预 测的 百分比 来表 示 。 尽管如此,也应该强调一个栅格的像元仅仅被赋予一个单一的值。 为了 GIS 数据 处理 , 栅格 模 型的一 个重 要的 特征 就是 每个栅 格中 的像 元的 位置 被预先 确 定, 所以 很容 易进 行重 叠运 算以比 较不 同图 层中 所存 储的特 征 。 由于 像元 位置 是预 先 确 定 的 , 且是相 同的 , 在 一个 具体 的应用 的不 同的 图层 中, 每个属 性可 以从 逻辑 上或 者从算 法上 与其 它图层 中的 像元 的属 性相 结合以 便产 生相 应的 重叠 中一个 的属 性值 。 其不 同于 基于图 层的 矢 量模型 之处 , 在 于图 层中 的面单 元彼 此是 独立 的, 直接地 比较 图层 必须 作进 一步处 理以 识别 重叠的属性。 体元( Voxels) : GIS 中基 于的栅 格表示 可以 被扩展 到三维 以产生 一个 体元( Voxel)模 型, 其 中 像 元 是 由 长 方 形 , 典型 是立 方体 、 立 体元 素所组 成。 地理 数据 的一 些类型 , 并 不总 是由边 界表 示的 , 因 为数 据值可 能与 一个 属性 相关 , 而 该属 性随 着位置 的变 化而变 化 , 而 且 并不是 清楚 地理 解边 界。 这类模 型的 数据 的一 个比 较合适 的模 型就 是体 元模 型。 该 模 型 被 广 泛地应 用于媒体成像, 其中它们 源于计算机辅助 断层( CT)及核磁反 应扫描仪。它 们很好 地表现渐进的、特殊的位置变化,并适于产生这种变化的剖面图。 3.要素模型 3. 1 欧氏( Euclidean)空间和欧氏空间中的三类地物要素 许多地 理现 象模 型建 立的 基础就 是嵌 入 ( Embed) 在 一个坐 标空 间中 , 在 这 种 坐标空 间 中,根据常用的公式就可以测量点之间的距离及方向,这个带坐标的空间模型叫做欧氏空间, 它把空间特性转换成实数的元组( Tuples)特性,两维的模型叫做欧氏平面。欧氏空间中, 最经常使用的参照系统是笛卡尔坐标系( Cartesian Coordinates),它是由一个固定的、特殊 的点为原点,一对相互垂直且经过原点的线为坐标轴。此外,在某些情况下,也经常采用其 它坐标系统,如极坐标系(Polar Coordinates)。 将地理要素嵌入到欧氏空间中,形成了三类地物要素对象,即点对象、线对象和多边形 对象。 3. 1. 1 点对象 点是有特定的位置,维数为零的物体,包括: .点实体(Point Entity ):用来代表一个实体; .注记点:用于定位注记; .内点(Label Point ):用于记录多边形的属性,存在于多边形内; .结点(节点)(Node ):表示线的终点和起点; .角点(Vertex ):表示线段和弧段的内部点。 3. 1. 2 线对象 线对象是 GIS 中非常常用的维度为 1 的空间组分,表示对象和它们边界的空间属性, 由一系列坐标表示,并有如下特征: .实体长度:从起点到终点的总长; .弯曲度:用于表示像道路拐弯时弯曲的程度; .方向性:水流方向是从上游到下游,公路则有单向与双向之分。 线状实体包括线段、边界、链、弧段、网络等,多边线如图 3-7 所示。 3. 1. 3 多边形对象 面状实体也称为多边形,是对湖泊、岛屿、地块等一类现象的描述。通常在数据库中由 一封闭曲线加内点来表示。面状实体有如下空间特性: .面积范围; .周长; .独立性或与其它的地物相邻,如中国及其周边国家; .内岛或锯齿状外形,如岛屿的海岸线封闭所围成的区域等; .重叠性与非重叠性,如报纸的销售领域,学校的分区,菜市场的服务范围等都有可能 出现交叉重叠现象,一个城市的各个城区一般说来相邻但不会出现重叠。 在计算几何中,定义了许多不同类型的多边形,如图 3-7 所示。 图 3-7:多边线和多边形 3. 2 要素模型的基本概念 基于要 素的 空间 模型 强调 了个体 现象 , 该 现象 以独 立的方 式或 者以 与其 它现 象之间 的 关 系 的 方 式 来 研究。 任何 现象 ,无 论大 小,都 可以 被确 定为 一个 对象( Object) ,假 设它 可以 从概念 上与 其邻 域现 象相 分离。 要素 可以 由不 同的 对象所 组成 , 而 且它 们可 以与其 它的 相分 离的对 象有 特殊 的关 系。 在一个 与土 地和 财产 的拥 有者记 录有 关的 应用 中, 采用的 是基 于要 素的视 点, 因为 每一 个土 地块和 每一 个建 筑物 必须 是不同 的, 而且 必须 是唯 一标识 的并 且可 以单个 地测 量。 一个 基于 要素的 观点 是适 合于 已经 组织好 的边 界现 象的 ,尽 管并不 被限 定 。 因此, 这也 适合 于人 为现 象的, 例如, 建筑 物、 道 路 、 设 施和 管理 区域。 一 些自然 现象 , 如 湖、 河 、 岛 及 森 林 , 经 常 被表现 在基 于要 素的 模型 中的, 因为 它们 为了 某些 目的, 可以 被看 成为离 散的 现象 ,但 应该 记住的 是, 这样 现象 的边 界随着 时间 的变 化很 少是 固定的 ,因 此 , 在任何时刻,它们的实际的位置定义很少是精确的。 基于要 素的 空间 信息 模型 把信息 空间 分解 为对 象 ( Object)或 实 体 ( Entity) 。 一个实 体 必须符合三个条件: . 可被识别; . 重要(与问题相关) ; . 可被描述(有特征) 。 而有关实 体的 特征, 可以 通过静态 属性 (如城 市名) 、动态的 行为 特征和 结构 特征来 描 述实体 。 与 基于 场的 模型 不同, 基于 要素 的模 型把 信息空 间看 作许 多对 象 ( 城市、 集镇 、 村 庄、区 )的集 合,而 这些 对象又 具有自 己的属 性( 如人口 密度、 质心和 边界 等) 。基 于要 素 的模型中 的实体可采用多种维度来 定义属性,包括:空间维 、时间维、图形维和文本 /数字 维。 空间对象 之所 以称为 “空 间的” , 是因为 它们存 在于 “空间” 之中 ,即所 谓“ 嵌入式 空 间” 。 空 间 对 象 的 定 义 取 决 于嵌入 式空 间的 结构 。 常 用的嵌 入式 空间 类型 有: ( 1) 欧 氏空 间, 它允许 在对 象之 间采 用距 离和方 位的 量度 ,欧 氏空 间中的 对象 可以 用坐 标组 的集合 来表 示 ; ( 2) 量 度 空间, 它允 许在 对象之 间采 用距 离量 度 ( 但不一 定有 方向 ) ; ( 3) 拓 扑空间 , 它 允 许在对 象之间 进行拓 扑关 系的描 述(不 一定有 距离 和方向) ; ( 4) 面向集 合的 空间, 它只采 用一般的基于集合的关系,如包含、合并及相交等。 1)欧氏平面上的空间对象类型 图 3-8 表示了在连续的二维欧氏平面上的一种可能的对象继承等级图。 空间对 象 延伸对 象零维对 象点 二维对 象一维对 象 环弧 简单环简单弧 面对象 面域对 象 域单位 对象 图 3-8:连续空间对象类型的继承等级 在上图 中, 具有 最高 抽象 层次的 对象 是 “ 空间 对象 ” 类 , 它 派 生 为 零 维 的 点 对象和 延伸 对象, 延伸 对象 又可 以派 生维一 维和 二维 的对 象类 。 一 维 对 象 的 两 个 子 类 : 弧和环 (Lo op) , 如果没 有相 交, 则称 为简 单弧( Simple Arc) 和简 单环( Simple Loop) 。在 二维空 间对 象类 中,连通的面对象称为面域对象,没有“洞”的简单面域对象称为域单位对象。 2)离散欧氏平面上的空间对象 欧氏空 间的 平面 因连 续而 不可计 算 , 必 须 离 散 化 后 才适合 于计 算 。 图 3-8 中所 有的连 续 类型的离散形式都存在。图 3-9 表示了部分离散一维对象继承等级关系 * 。 离散一 维对 象 B样 条 曲 线 多边线 线段 图 3-9:离散一维对象的继承等级 对象行为 是由 一些操 作定 义的。这 些操 作用于 一个 或多个对 象( 运算对 象) , 并产生 一 个新的 对象( 结果) 。可将 作用于 空间对 象的空 间操 作分为 两类: 静态的 和动 态的。 静态操 作不会 导致 运算 对象 发生 本质的 改变 , 而动态 操作 会改变 ( 甚 至 生成或 删除 ) 一 个或 多个 运 算对象。 虽然系 统的 面向 对象 方法 和基于 要素 的空 间数 据模 型在概 念上 很相 似 , 但 两 者 之间仍 然 有着明 显的 差别 。 实 现基 于要素 的模 型并 不一 定要 求运用 面向 对象 的方 法; 另一方 面 , 面 向 对象方法既可 以作为描述 场的空间模型 的框架,也 可以作为描述 基于要素的 空间模型的 框 架。 对于 基于 要素的 模型 , 采 用面 向对 象的描 述是 显然合 适的 ; 而对于 基于 场的模 型同 样 可 以用面向对象方法来构建。 场和对 象可 以在 多种 水平 上共存 , 对 于空 间数 据建 模来说 , 基 于场 的方 法和 基于要 素的 方法并 不互 相排 斥。 有些 应用可 以很 自然 地应 用场 来建模 , 如 前面 例子 中提 到的某 一区 域的 气候属 性变 化就 适合 于建 立场模 型 ; 但 是 , 即 使 是 在这种 情况 下 , 场模 型也 并不是 适合 所有 情况 。 例 如, 如果 采集 降 雨数据 的各 个点 在空 间上 很分散 且分 布无 规律 , 加 之这些 采集 点还 有各自 的特 征 , 那么 , 一 个包含 两个 属性 , 即 位置 和平均 降雨 量的 对象 也许 更适合 于区 域气 候属性 变化 的描 述。 总之 , 基 于场 的模 型和基 于要 素的模 型各 有长 处, 应该 恰当地 综合 运 用 这两种 方法 来建 模。 在地 理信息 系统 应用 模型 的高 层建模 中、 数据 结构 设计 中及地 理信 息系 统应用中,都会遇到这两种模型的集成问题。图 3-10 描述了要素模型和场模型的比较。 现实世界 选择要素 选择一个位置 要素模型 场模型 它在哪里 那里怎么样 数据 图 3-10:要素模型和场模型的比较 [A. Vckovski] 3. 3 矢量数据模型 矢量方 法 ( 图 3-11) 强 调了 离 散 现 象 的 存在, 由边界 线 ( 点、 线、 面) 来 确 定 边 界 , 因 此可以 看成 是基 于要 素的 。然而 ,在 一些 基于 矢量 的 GIS 中, 表现 表面 的便 利,带 给它 模 拟二维 场的 可能 性, 最常 见的例 子就 是地 表高 程。 栅格技 术将 重点 放置 在了 空间格 网像 元位 置的内 容上 , 因 此经 常被 描述为 基于 位置 的。 栅格 数据模 型似 乎与 上面 所描 述的场 的观 点相 似, 但 是 所 储 存 的 空 间 信 息模型 并不 是对 一个 连续 变量的 描述 , 而 它是 格网 ——像 元值 的一 个集合 , 这 些值 当然 可以 被看成 抽样 一个 场模 型, 但是同 样可 以被 抽样 成一 个基于 对象 的模 型。 * 其中 B样条曲线的描述见“空间分析”一章,多边线属于一维的无约束的样条曲线。 图 3-11:矢量数据模型 矢量数 据模 型将 现象 看作 原形实 体的 集合 , 且 组成 空间实 体 。 在 二维模 型内 , 原 型实 体 是点、 线和 面; 而在 三维 中, 原 型 也 包 括 表 面 和 体 。 观察 的尺 度或 者概 括的 程度, 决定 了使 用的原 型的 种类 。 在 一个 小比例 尺表 现中 , 诸 如城 镇这一 现象 可以 由个 别的 点所组 成 , 而 路 和河流 由线 来表 示。 当表 现的比 例尺 增大 时, 必然 要考虑 到现 象的 尺度 ; 在 一个中 等比 例 尺 上, 一 个 城 镇 可 以 由 特 定 的原型 , 如 线, 来表 示用 以记录 其边 界。 在较 大的 比例尺 中, 城镇 将被表 现为 特定 的原 型的 复杂的 集合 , 包括建 筑物 的边界 、 道 路 、 公 园 以 及 所包含 的其 它的 自然与管理现象。 矢量模 型的 表达 源于 原型 空间实 体本 身, 通常 以坐 标来定 义。 一个 点的 位置 可以二 维或 者三维 中的 坐标 的单 一集 合来描 述。 一条 线通 常由 有序的 两个 或者 多个 坐标 对集合 来表 示 。 特定坐 标之 间线 的路 径可 以是一 个线 性函 数或 者一 个较高 次的 数学 函数 , 而线 本身可 以由 中 间点的 集合 来确 定。 一个 面通常 由一 个边 界来 定义 , 而 边 界 是 由 形 成 一 个 封 闭的环 状的 一条 或多条线所组成。如果区域有个洞在其中,那么可以采用多个环以描述它。 依据应 用的 类型 , 对 采用 矢量数 据描 述三 维模 型有 一些特 殊的 要求 。 地 形模 型应用 要求 或者是 简单 的、 单一 值的 表面 ( 单 一 值 的 表 面 是 指 对于任 意的 位置 , 都 有单 一的、 确定 的高 程数值 ) , 这 仅 可 以 表 示 地 表高程 ; 或 者 它们与 地形 表面的 地形 特征 相结 合, 在景观 结构 中, 有必要将地形表面与特征的三维表现结合起来,例如位于其上的建筑物与植被 * 。为了制图 目的 , 表 现地 形表面 的传 统方法 可以 采用 等高 线, 而对于 分析 目的 而言 , 等 高线并 不是 一 个 方便的 表示; 如果表 面被 采样为 等值线 (也许 从一 个地图 上被数 字化) ,它们 通常将 被转换 成最通 用的 基于 GIS的 地形表 现, 如规 则格 网及 不规则 三 角网。 点值 的规 则格网 、 或 者矩 阵 , 可以直 接地 来自 一个 原始 的规则 的抽 样的 方案 中 , 通常 情 况下, 是对 不规 则分 布数 值 的 内 插 , 不规则 分布 数值 可以 包括 数字化 等高 线和 离散 点的 高程数 值。 TIN的 特 征 是 它 们保留 了原 始 的不规 则抽 样的 数据 值, 它是一 个三 角化 的被 用来 表现一 个三 角形 的平 面, 并与这 些原 始数 值 相联系 。一个 TIN单元的 表面在 缺省情 况下被看成 平面( Plannar) , 但是顶点 之间也 可以 采用曲面函数来进行插值。 如果 TIN 被用 来表 现一 个 单一值 的表 面 ( 无 论 是 地 形数据 还是 其它 ) ,在 与一个 插 值 函 数相结 合的 情况 下, 它提 供了一 个二 维场 的数 字化 的表现 。 同 样 地 , 如 果 一 个采样 点格 网同 * 与 DEM相对应, 能够描述地面植被和建筑的模型称为数字表面模型 ( Digital Surface Model ,DSM) ,它 在 建筑规划,生态等领域有着较广泛的用途。 时伴随着一个采样点之间插值函数,它也可以用于实现一个场模型。 如果体 对象 被存 储于 基于 矢量 的 GIS 中 , 它 们 通 常 由闭合 的一 个或 者多 个表 面来定 义 ; 而表面 可以 由三 维线 包围 的多边 形面 所定 义。 线及 其构成 的点 , 或顶点 的集 合, 定义 了这 样 的表面 为一 个多 边形 网状 结构 。 网 的 每 个 表 面 被 视 为 平面的 或者 是曲 面的 ; 在这 两种情 况下 , 需要一 个数 学的 函数 用来 指示具 体坐 标之 间表 面的 位置。 如果 需要 一个 光滑 的表面 , 可 以通 过多边 形网 的顶 点来 构造 数字表 面函 数, 那么, 这样 一个表 面的 计算 机图 形展 示就可 以通 过 将数字 的表 面分 解成 非常 小的平 面来 实现 。数 学表 面函数 的例 子 如 B 样 条 函 数。这 些类 型 的函数 控制 了已 知的 控制 点与拟 合表 面之 间的 关系 , 包括了 表面 的度 量以 及它 与控制 点之 间 的近似程度。 4.基于要素的空间关系分析 4. 1 空间关系的基本概念 在地理信息系统中集中存储了以下的内容: . 空间分布位置信息 . 属性信息 . 拓扑空间关系信息。 由此可见,空间位置、关系与度量的描述在 GIS 中起着举足轻重的作用。 地理要素 之间 的空间 区位 关系可抽 象为 点、线 (或 弧) 、多 边形( 区域) 之间 的空间 几 何关系,其关系如下,如图 3-12 示。 图 3-12:地理要素之间的部分拓扑空间关系 1)点——点关系 相合; 分离; 一点为其它诸点的几何中心; 一点为其它诸点的地理重心。 2)点——线关系 点在线上:可以计算点的性质,如拐点等; 线的端点:起点和终点; 线的交点; 点与线分离:可计算点到线的距离。 3)点——面关系 点在区域内,可以记数和统计; 点为区域的几何中心; 点为区域的地理重心; 点在区域的边界上; 点在区域外部。 4)线——线关系 重合; 相接:首尾环接或顺序相接; 相交: 相切; 并行。 5)线——面关系 区域包含线:可计算区域内线的密度; 线穿过区域: 线环绕区域:对于区域边界,可以搜索其左右区域名称; 线与区域分离。 6)面——面关系 包含:如岛的情形; 相合: 相交:可以划分子区,并计算逻辑与、或、非和异或; 相邻:计算相邻边界的性质和长度; 分离:计算距离、引力等。 近年来,空间关系的理论与应用研究在国内外都非常多。究其原因,一方面是它为地理 信息系统数据库的有效建立、空间查询、空间分析、辅助决策等提供了最基本的关系;另一 方面是将空间关系理论应用于地理信息系统查询语言,形成一个标准的 SQL 空间查询语言, 可以通过 API(Application Program Interface ,应用程序接口)进行空间特征的存储、提取、 查询、更新等。 空间关系包含三种基本类型,即拓扑关系、方向关系、度量关系。 4. 2 拓扑空间关系分析 4. 2. 1 拓扑属性 拓扑一词来自于希腊文,意思是“形状的研究”。拓扑学是几何学的一个分支,它研究 在拓扑变换下能够保持不变的几何属性——拓扑属性。为了得到一些拓扑的感性认识,假设 欧氏平面是一张高质量无边界的橡皮,该橡皮能够伸长和缩短到任何理想的程度。想象一下 基于这张橡皮所绘制的图形,允许这张纸伸长但是不能撕破或者重叠,这样原来图形的一些 属性将保留,而有些属性将会失去。例如,在橡皮表面有一个多边形,多边形内部有一个点。 无论对 橡皮 进行 压缩 或拉 伸, 点 依 然 存 在 于 多 边 形 内部, 点和 多边 形之 间的 空间位 置关 系不 改变, 而多 边形 的面 积则 会发生 变化 。 前 者则 是空 间的拓 扑属 性, 后者 则不 是拓扑 属性 。 表 3-2 列出了包含在欧氏平面中的对象的拓扑和非拓扑属性。 表 3-2:欧氏平面上实体对象所具有的拓扑和非拓扑属性 拓扑属性 一个点在一个弧段的端点 一个弧段是一个简单弧段(弧段自身不相交) 一个点在一个区域的边界上 一个点在一个区域的内部 一个点在一个区域的外部 一个点在一个环的内部 一个面是一个简单面(面上没有“岛” ) 一个面的连续性 (给定面上任 意两点, 从一点可以完全在面的内部沿任意路径走向另 一点) 非拓扑属性 两点之间的距离 一个点指向另一个点的方向 弧段的长度 一个区域的周长 一个区域的面积 从表中可以看出,拓扑 属性描述了两个对象之 间的关系,因此又称为 拓扑关系 ( Topological Relation) 。图 3-13 为拓扑空间关系的形式化表达。 图 3-13:拓扑空间中的点和邻域 4. 2. 2 拓扑描述的数学基础——点集拓扑学 拓扑学 是几 何学 分支 之一 , 作 为 近 代 数 学 的 一 门 基 础理论 学科 , 拓 扑学 已经 渗透到 数学 的许多 分支 以及 物理 、 化 学和生 物学 之中 , 而 且在 工程技 术中 也获 得了 广泛 的应用 。 由 于 拓 扑学是研究图 形在拓扑变 化下不变的性 质,拓扑学 已成为地理信 息系统空间 关系的理论 基 础, 为 空 间 点 、 线 、 面 之 间的包 含、 覆盖 、 相 离和 相接等 空间 关系 的描 述提 供直接 的理 论依 据。 定义 1: X 为一非空集合, ρ :X×X→ R 为一映射,如果对于任意的 x, y, z∈ X,有 : (1)ρ (x, y)≥ 0,并且 ρ (x, y)=0 当且仅当 x=y; (2)ρ (x, y)=ρ (y, x); (3)ρ (x, z)≤ρ (x, y)+ρ (y, z) (三角不等式 ); 则称 ρ 为 X 的度量,偶对 (X,ρ )称为度量空间。 定义 2: A 为度 量空 间 X 的 子 集,如 果 A 的 每 一 点 都有一 个球 形邻 域包 含 于 A,则 称 A 为 ρ 的开集。 定义 3: X 为非空集合, A 为 X 的子集族,如果满足下列条件: (1) X 和空集 Φ 属于 A; (2)若 A1, A2 属于 A,则 A1 与 A2 的交集属于 A; (3)A 中任意两个元素的并仍为 A 中的元素; 则称 A 为 X 的拓扑。如果 A 为集合 X 的拓扑,则称偶对 (X, A)为拓扑空间。 定义 4: A 为拓 扑空 间 X 的子集 。如 果点 x 属于 X 的每一 邻域 U 中都 有 A 中异 于 x 的 点, 即 U∩ (A~{ x} )≠Φ ,则 称 x 为 A 的聚 点或 极 限点。 A 的聚 点可 以属 于 A 也可 以不 属 于 A。 定义 5: A 为拓 扑空 间 X 的子集 ,集 合 A 的 所 有 聚 点构成 的集 合称 为 A 的 导 集,记 作 dX(A)或 d(A)。 定义 6: A 为拓 扑空 间 X 的子 集, 如果 A 的 每 一 聚点都 属于 A,即 d(A)为 A 的子 集, 则 称 A 为闭集。 定义 7: X 为拓 扑空 间, X 的子 集 A 与 A 的导 集 d(A)的并 集 A∪ d(A)称为 A 的 闭包, 记 作 C(A)。 定义 8: 为拓 扑空 间 X 的 子集, 如果 A 是点 x 属于 X 的邻 域, 即存 在 X 的开 集 U 使得 x 属于 U, U 为 A 的子 集, 则 称 点 x 为集 合 A 的 内点。 集合 A 的所 有内 点构 成 的集合 , 称 为 A 的内部,记作 I(A)。 定义 9: A 为拓 扑空 间 X 的子 集, 对于 点 x 属于 X,如 果 在 x 的任 一邻 域 U 中既有 A 的 点又有 ~ A 的点 , 即 : U∩ A≠Φ 并且 U∩ (~ A)≠Φ ,则称 x 为集 合 A 的 边界点 。 集 合 A 的 所有边界点的集合称为集合 A 的边界,记作 B(A)。 定理 1: A 为拓扑空间 X 的任意子集,则 : C(A)=~ I(~ A)=I(A)∪ B(A) I(A)=~ C(~ A)=C(A)~ B(A) B(A)=C(A)∩ C(~ A)=~ (I(A)∪ I(~ A))=B(~ A) 4. 2. 3 拓扑空间关系描述—— 9 交模型 设有现 实世 界中 的两 个简 单实体 A、 B, B(A)、 B(B)表示 A、 B的 边界, I(A)、 I(B)表示 A、 B的内 部, E(A)、 E(B)表示 A、 B余。 Egenhofer[1993]构造出 一个 由边 界、 内部 、 余 的点 集组 成的 9-交空间关系模型 (9-Intersection Model,9-IM)如下 * : B(A)∩ B(B) B(A)∩ I(B) B(A)∩ E(B) I(A)∩ B(B) I(A)∩ I(B) I(A)∩ E(B) E(A)∩ B(B) E(A)∩ I(B) E(A)∩ E(B) 对于该 矩阵 中的 每一 元素 , 都 有 “ 空 ” 与 “ 非 空 ” 两 种取值 , 9 个元 素总 共可 产 生 2 9 =512 种情形。 9 交模 型形 式化 地描 述了 离散空 间对 象的 拓扑 关系 , 基 于 9 交 模型, 可以 定 义空间 数据 库的一 致性 原则 , 并 应 用 于数据 库更 新 、 维 护 中 。 此外 , 9 交模 型也 是进 一 步研究 空间 关系 的基础 * 。 9 交模 型一 共可 以表 达 512 种 可 能 的 空 间 关 系 , 但 是在 实 际上, 有些 关系 并不存 在。 表 2 给出 了面 /面 (A/A),面 /线 (A/L),面 /点( A/P) ,线 /线( L/L) ,线 /点( L/P) ,点 /点( P/P) 可能空 间关系 的矩阵 形式 。其中 “ -”表示不可 能存 在该关 系, “ Yb” 表示在 单值和 多值的 * 在另外一些表述中, B(A), I(A), E(A)分别为: ? A, O A和 - A。 * 在这方面,比较有意义的工作是 Egenhofer等进行的 9 交模型与自然语言中空间关系描述的对应研究。 矢量图上都可能存在的关系,“Ym ”在多值的矢量图上可能存在的关系 * 。 表 3-3:通过 9-交模型表示的两个要素可能的拓扑关系(表中将矩阵的 9 个数值展开得 到一个二进制数值,1 表示相应交集不为空,0 表示交集为空) 关系 9-交模型矩阵 A/A A/L A/P L/L L/P P/P r026 000011010 - - - - - Yb r030 000011110 - - Yb - Yb - r031 000011111 Yb Yb - Yb - - r063 000111111 - Yb - Yb - - r092 001011100 - - Yb - Yb - r093 001011101 - - - Yb - - r095 001011111 - - - Yb - - r127 001111111 - - - Yb - - r159 010011111 - - - Yb - - r179 010110011 Ym - - Ym - - r191 010111111 - Yb - Yb - - r220 011011100 Ym Yb - Ym - - r223 011011111 - - - Yb - - r252 011111100 - Yb - - - - r253 011111101 - Yb - - - - r255 011111111 - Yb - Ym - - r272 100010000 - - - - - Ym r277 100010101 - - - Yb - - r279 100010111 Yb - - - - - r284 100011100 - - Yb - Yb - r285 100011101 Yb Yb - - - - r287 100011111 Yb Yb - Yb - - r311 100110111 - - - Yb - - r316 100111100 - Yb - - - - r317 100111101 - Yb - - - - r319 100111111 - Yb - - - - r349 101011101 - - - Yb - - r373 101110101 - - - Yb - - r400 110010000 Ym - - Ym - - r412 110011100 - Yb - - - - r415 110011111 - - - Yb - - r435 110110011 Ym - - Ym - - r439 110110111 - - - Yb - - r444 110111100 - Yb - - - - r445 110111101 - Yb - - - - r447 110111111 - Yb - - - - r476 111011100 Ym Yb - Ym - - r477 111011101 - - Yb - - r501 111110101 - - Yb - - r508 111111100 - Yb - - - - r509 111111101 - Yb - - - - r511 111111111 Yb - - - - - 从上表可以看出,可能的拓扑关系数目要远远少于 512 个(面/ 面: 6,面 /线: 19,面 / 点:3 ,线/ 线: 16,线/ 点: 3,点 /点: 2) 。图 3-14 给出了这些可能关系的图示。从某种意 义上讲, 9-交模型所描述的拓扑关系只是拓扑关系的类别,对于每一类别可以有多种可能的 情形,例如两条相交的线,一个交点的情形和多个交点的 9-交模型表示是一致的,但是其 拓扑关系并不同。 * 所谓单值矢量图是指对于一给定点,最多只能属于一个地物要素,即地物不能重叠;而对于多值矢量图, 地物可以重叠。 r031 r279 r220 r285 r476 511 r287 r179 r400 r435 r031 r255 r285 r063 r412 r191 r319 r253 r316 r220 r030 r284 r092 r030 r092 r284 r031 r159 r255 r435 r400 r095 r287 r277 面 /面关 系 面 /线关 系 面 /点关 系 线 /点关 系 线 /线关 系 图 3-14: 9-交模型所述拓扑关系图示 9 交模型的扩展 通过引进点集的余 , 9-交空间关系模型增强 了面 /线、线 /线空间关系的唯一性 。但它仅 仅 用 “ 空 ” 与 “ 非空” 来区 分两 个目 标的 边界、 内部 、余 ,对 面 /面、 点 /点、点 /线、 点 /面 的空间关系描述并无多大改进。为此,该方法仍有一定的局限性。 在地理 信息 系统 中, 数据 可以划 分为 几何 数据 与属 性数据 两大 类型 。 由 于几 何数据 具有 可量测 性, 为此 地理 信息 系统所 涉及 的客 观世 界是 一个度 量空 间, 而且 每个 度量空 间又 是一 个拓扑 空间 。 根 据目 标的 自由度 , 基 本实 体可 划分 为点、 线、 面三 种基 本类 型。 点 状 目 标 具 有固定 的位 置和 方向 , 将 其定义 为零 维目 标; 线状 目标都 有一 条有 形或 无形 的定位 线 , 将 其 定义为一维目标;面状目标都有一个有形或无形的轮廓线,将其定义为二维目标。 运用维 数扩 展法 , 将 9-IM 进行扩 展 ,利用 点 、 线 、 面的边 界 、内部 、 余之间 的交集 的维 数 来作为 空间 关系 描述 的框 架。对 于几 何实 体的 边界 ,它是 比其 更低 一维 的几 何实体 的集 合 。 为此,点 的边界为空集;线的边界 为线的两个端点,当线为 闭曲线时,线的边界为空 ;面的 边界由构成面的所有线构成。若设 P 为一个点集,定义点集的求维函数 DIM 如下: 利用维数扩展法, 9 交模型可扩展为 DIM(B(A)∩ B(B)) DIM(B(A)∩I (B)) DIM(B(A)∩E (B)) DIM(I(A)∩B (B)) DIM(I(A)∩I (B)) DIM(I(A)∩E (B)) DIM(E(A)∩B (B)) DIM(E(A)∩I (B)) DIM(E(A)∩E (B)) 2)根据 DE-9IM,对于点集拓扑空间 X,当需要进行关系判别时,可对矩阵的 9 元取 值进行分析、比较。令 C 为各单元交的点集,其取值 P 可能为 { T, F, *, 0, 1, 2} 。各个 取值的具体含义为: 1)P=T DIM(C)∈{ 0, 1, 2} ,即交集 C 包含有点、线、面; 2)P=F DIM(C)=-1,即交集 C 为空; 3)P=* DIM(C)∈{ -1, 0, 1, 2} ,即两目标交集既有点、线、面,又含有某些部分的交 为空的情形,该情况在关系判别时,一般不予以考虑; 4) P=0 DIM(C)=0; 5) P=1 DIM(C)=1; 6) P=2 DIM(C)=2。 扩展 9-交模型中各元素通过取值 { T, F, *, 0, 1, 2} ,可产生的情形为 6 9 =10077696 种,关系非常复杂,通过对大量的空间关系进行归纳和分类,得出 5 种基本的空间关系:相 离关系(Disjoint) 、相接关系(Touch)、相交关系 (Cross)、包含于关系 (In)、交叠关系 (Overlap), 并将这 5 种关系定义为空间关系的最小集,其特征为: 1) 相互之间不能进行转化; 2) 能覆盖所有的空间关系模式; 3) 能应用于同维与不同维的几何目标; 4) 每一种关系对应于唯一的 DE-9IM 矩阵; 5) 任何其它的 DE-9IM 关系可以通过用这 5 种基本关系进行表达。 4. 2. 4 拓扑空间关系识别 在地理信息系统中,空间数据具有属性特征、空间特征和时间特征,基本数据类型包括 属性数据、几何数据和空间关系数据。作为基本数据类型的空间关系数据主要指点 /点、点/ 线、点/ 面、线/ 线、线/ 面、面/ 面之间的相互关系。 4. 3 方向空间关系分析 4. 3. 1 方向关系描述 方向关系又称为方位关系、延伸关系,它定义了地物对象之间的方位,如“河北省在河 南省北部”就描述了方向关系。为了定义空间目标之间的方向关系,首先定义点目标之间的 关系。给定定位参考,即相互垂直的 X、 Y坐标轴,方向关系的定义采用垂直于坐标轴的直 线为参考。令 P i 为目标P 的点 (P为原目标 ), Q j 为目标 Q的点 (Q为参考目标) , X(P i )与Y(P i )函数 返回点 P i 的X 、 Y坐标。则 P与 Q在二维空间中具有以下 8 种可能关系,并提供了一个完整的 关系覆盖。这些关系定义为: Restricted_East(P i , Q j )= X(P i )> X(Q j ) And Y(P i )=Y(Q j ) Restricted_South(P i , Q j )=X(P i )=X(Q j ) And Y(P i )< Y(Q j ) Restricted_West(P i , Q j )=X(P i )< X(Q j ) And Y(P i )=Y(Q j ) Restricted_North(P i , Q j )=X(P i )=X(Q j ) And Y(P i )> Y(Q j ) North_West(P i , Q j )=X(P i )< X(Q j ) And Y(P i )> Y(Q j ) North_East(P i , Q j )=X(P i )> X(Q j ) And Y(P i )> Y(Q j ) South_West(P i , Q j )=X(P i )< X(Q j ) And Y(P i )< Y(Q j ) South_East(P i , Q j )=X(P i )> X(Q j ) And Y(P i )< Y(Q j ) 以上 8 种关系通过点的投影可以精确判断。如有任意两点, 上述 8 种关系必有一种满足。 而且,这些关系具有传递性,另外一些关系可进行相互转换 (如 North_East(PI, QJ)South_West(QI,PJ) ,通过对上述 8 种关系进行扩充,可得出另外 4 种方向关系,即: East(P i , Q j )=North_East(P i , Q j ) Or Restricted_East(P i , Q j ) Or South_East(P i , Q j ) South(P i , Q j )=South_West(P i , Q j ) Or Restricted_South(P i , Q j ) Or South_East(P i , Q j ) West(P i , Q j )=North_West(P i , Q j ) Or Restricted_West(P i , Q j ) Or South_West(P i , Q j ) North(P i , Q j )=North_West(P i , Q j ) Or Restricted_North(P i , Q j ) Or North_East(P i , Q j ) 以点目标之间的方向关系为基础,其余目标之间的方向关系可类似定义。 4. 3. 2 方向关系识别 MBR(Minimum Bounding Rectangle)指的是空间目标的外切矩形。 MBR 的表示非常简 单,只需利用两点( 左上、右下角点) 表示即可。由于 MBR 的简单、实用性, MBR 广泛应用 于空间目标数据结构表示以及空间数据查询中。 为了确定目标之间是否具有某种方向关系,首先可判断目标之间的 MBR 是否具有该关 系,然后再利用点/ 点关系进一步进行关系判断,确定具体的关系。 4. 4 度量空间关系分析 基本空间对象度量关系包含点/ 点、点 /线、点 /面、线/ 线、线/ 面、面/ 面之间的距离。在 基本目标之间关系的基础上,可构造出点群、线群、面群之间的度量关系。例如,在已知点 /线拓扑关系与点/ 点度量关系的基础上, 可求出点 /点间的最短路径、最优路径、服务范围等; 已知点、线、面度量关系,进行距离量算、邻近分析、聚类分析、缓冲区分析、泰森多边形 分析等。 4. 4. 1 空间指标量算 定量量测区域空间指标和区域地理景观间的空间关系是地理信息系统特有的能力。 其中 区域空间指标包括: 1)几何指标:位置、长度(距离)、面积、体积、形状、方位等指标; 2)自然地理参数:坡度、坡向、地表辐照度、地形起伏度、河网密度、切割程度、通 达性等; 3)人文地理指标:如集中指标、区位商、差异指数、地理关联系数、吸引范围、交通 便利程度、人口密度等。 4. 4. 2 地理空间的距离度量 地理空间中两点间的距离度量可以沿着实际的地球表面进行, 也可以沿着地球椭球体的 距离量算,具体的,距离可以表现为以下几种形式(以地球上两个城市之间的距离为例) (图 3-15) : 1)大地测量距离 :该距离即沿着地球大圆经过两个城市中心的距离。 2)曼哈顿距离 : 纬 度差加 上经度 差( 名字 “曼哈 顿 距离” 是由 于在 曼哈顿 , 街道的 格 局可以被模拟成两个垂直方向的直线的一个集合) 。 3)旅行时间距 离 : 从一个 城市到 另一 个城 市的最 短 的时间 可以 用一 系列指 定 的航线 来 表示(假设每个城市至少有一个飞机场) 。 4)词典编纂距离 :在一个固定的地名册中一系列城市中它们位置之间的绝对差值。 图 3-15:地球上各种形式的距离 5.网络结构模型 5. 1 网络空间 网络拓 扑系 统研 究的 创始 人被公 认为 数学 家 Leonard Euler,他 在 1736 年 解 决 了当时 一 个著名 的问 题, 叫做 Konigsberg 桥问题 。图 3-16-a 显示了 该桥 的一 个概 略的 路线图 。该 问 题就是 找到 一个 循环 的路 , 该 路只 穿过 其中每 个桥 一次 , 最 后返 回到起 点 。 一些实 验表 明这 项任务是不可能的,然而,从认为没有这样的路线到说明它的步骤并不是这样容易的。 (a) (b) 图 3-16:Konigsberg Park 中的图形理论模型 Euler 成功地证明了这是一项不可能的任务;或者,换一句话来说,这个问题是没有解 的。为了做这件事,他建立了该桥的一个空间模型,该模型抽象出了所有的仅有的桥之间的 拓扑关系,见图 3-16-b。实心圆表示结点或顶点。它们被标上 w、 x、y 、z ,并且抽象为陆 地面。线表示弧段或边线,它们抽象为陆地之间的直线, 并且在每种情况下需要使用一个桥, 完整的模型叫做网络或图形。 Euler 证明了不可能从一个结点开始,沿着图形的边界,遍历 每个边界只有一次,最后到达第一个结点。他所采用的论点是非常简单的,依据的是经过每 个结点的边的奇数 /偶数。我们看到:除了开始的结点和末端的结点外,经过一个结点的路 径必须是沿着一个边界进入,又沿着另一个边界出去。这说明了两个边界对应着那个结点。 因此,如每个中间结点相连的边界的数量必须是偶数,当然,如果这个问题是有解的话。图 3-15 中,没有一个结点的边界数是偶数的。因此,这个图论的问题是没有解的,并且与 Konigsberg 桥问题有关的最初的问题也是无解的。 5. 2 网络模型 在网络模型中,地物被抽象为链、节点等对象,同时要关注其间连通关系 * 。基于网络 的空间模型与基于要素的模型在一些方面有共同点,因为它们经常处理离散的地物,但是最 基本的特征就是需要多个要素之间的影响和交互,通常沿着与它们相连接的通道。相关的现 象的精确形状并不是非常重要的,重要的是具体现象之间距离或者阻力的度量。网络模型的 典型的例子就是研究交通,包括陆上、海上及航空线路,以及通过管线与隧道分析水、汽油 及电力的流动。例如,一个电力供应公司对它们的设施管理可能既采用了一个基于要素的视 点,同时又采用了一个基于网络的视点,这依赖于他们关心的是否是替换一个特定的管道, 在这种情况下,一个基于要素的视点可能是合适的;或者例如他们关心的是分析重建线路的 目的,在这种情况下,网络模型将是合适的。 网状模型的基本特征是,结点数据间没有明确的从属关系,一个结点可与其它多个结点 建立联系。网状模型将数据组织成有向图结构。结构中结点代表数据记录,连线描述不同结 点数据间的关系。有向图(Digraph )的形式化定义为: Digraph = (Vertex,{Relation}) 其中 Vertex 为图中数据元素(顶点)的有限非空集合; Relation 是两个顶点( Vertex) 之间的关系的集合。 有向图结构比树结构具有更大的灵活性和更强的数据建模能力。网状模型可以表示多对 多的关系,其数据存储效率高于层次模型,但其结构的复杂性限制了它在空间数据库中的应 用。 网状模型反映了现实世界中常见的多对多关系,在一定程度上支持数据的重构,具有一 定的数据独立性和共享特性,并且运行效率较高。但它在应用时也存在以下问题: .网状结构的复杂,增加了用户查询和定位的困难。它要求用户熟悉数据的逻辑结构, 知道自身所处的位置。 .网状数据操作命令具有过程式性质。 .不直接支持对于层次结构的表达。 .基本不具备演绎功能。 .基本不具备操作代数基础。 * 在“空间分析”一章中的“网络分析”部分更加具体的描述了网络模型。 6.时空模型 6. 1 时空数据模型概述 6. 1. 1 研究概述 传统的 地理 信息 系统 应用 只涉及 地理 信息 的两 个方 面: 空 间 维 度 和 属 性 维 度 , 因此也 叫 SGIS(Static GIS),而能够同时处理时间维度的 GIS 叫 TGIS( Temporal GIS) 。 在 GIS 中 , 具 有 时 间 维 度 的数据 可以 分为 两类 , 一 类是可 以称 为结 构化 的数 据, 如一 个 测站历 史数 据的 积累, 它可 以通过 在属 性数 据表 记录 中简单 地增 加一 个时 间戳 ( Time Stamp) 实 现 其 管 理;另一 类是 非结 构 化 的 , 最 典 型 的 例 子 是 土 地 利 用 状 况 的 变化(图 3-17) ,描述 这种数据,是 TGIS 数据模型的重点要解决的问题。 图 3-17:土地利用随时间的推移而变化 TGIS 数据 模型 特点 是语 义 更丰富 、对 现实 世界 的描 述更准 确, 其物 理实 现的 最大困 难 在于海 量数 据的 组织 和存 取。 TGIS 技术 的本 质特 点是 “时 空效 率 ” 。 当 前 主要的 TGIS 模型 包括: 空间 时间 立方 体模 型( Space-time Cube) ; 序 列快照 模型 ( Sequent Snapshots) ;基 图 修正模 型 ( Base State with Amendments) ; 空间时 间 组合体 模型 ( Space-time Composite) 。其 中序列 快照 模型 和 GIS 分类 中 的模拟 GIS( Analog GIS) 一 样, 只是 一种 概念上 的 模 型 , 不 具备实 用的 开发 价值 , 而 其它几 种模 型都 有自 己的 特点和 适用 范围 , 如 基图 修正模 型比 较适 合于栅格模型的 TGIS 开发。 6. 1. 2 TGIS 的研究思路 TGIS 海 量 数 据 的 处 理 必 然 导致数 学模 型的 根本 变化 。 TGIS 问 题的最 终解 决在 于 “ 可与 拓扑论 相类 比的 ”全 新数 学思路 的出 现。 目前 可以 研究 TGIS 技术, 以便在 SGIS 的框架 中 用 TGIS 技术实现 TGIS 功能。对 TGIS 模型的研究可以本着两种思路进行平行探索:综合 模型和分解模型。先用分解模型思路针对典型应用领域(如土地利用动态监测工作)进行全 面研究,同时不断丰富、充实综合模型,最后得到一个比较完善的综合模型。 6. 2 时空数据模型设计的基本思想 地籍变更、海岸线变化、土地城市化、道路改线、环境变化等应用领域,需要保存并有 效地管理历史变化数据,以便将来重建历史状态、跟踪变化、预测未来。这就要求有一个组 织、管理、操作时空数据的高效时空数据模型。时空数据模型是一种有效组织和管理时态地 理数据,属性、空间和时间语义更完整的地理数据模型。 一个合理的时空数据模型必须考虑以下几方面的因素:节省存储空间、加快存取速度、 表现时空语义。时空语义包括地理实体的空间结构、有效时间结构、空间关系、时态关系、 地理事件、时空关系。时空数据模型设计的基本指导思想: (1)根据应用领域的特点(如宏观变化观测与微观变化观测)和客观现实变化规律(同 步变化与异步变化、频繁变化与缓慢变化),折中考虑时空数据的空间/ 属性内聚性和时态内 聚性的强度,选择时间标记的对象。对于属性,有属性数据项时间标记、实体时间标记、数 据库时间标记;对于空间,有坐标点时间标记、弧段时间标记、实体时间标记、数据库时间 标记。 (2)同时提供静态(变化不活跃)、动态(变化活跃)数据建模手段(静态、动态数据 类型和操作)。当前、历史等不同使用频率的数据分别组织存放,以便存取。一般地,将当 前数据存放在本地机磁盘上,而将历史数据存放在远程服务器大容量光盘上。 (3)数据结构里显式表达两种地理事件:地理实体进化事件和地理实体存亡事件。地 理事件以事件发生的相关源状态和终止状态表达。构成地理实体存亡事件的源状态有参加事 件的实体标识集合表示。时间的本质为事件发生的序列,地理事件序列直接表明地理时间语 义。常见的状态变化查询即地理事件查询。 (4)时空拓扑关系一般指地理实体空间拓扑关系的拓扑事件间的时态关系。时空拓扑 关系揭示了地理实体在时间和空间上的相关性。为了有效地表达时空拓扑关系,需要存储空 间拓扑关系的时变序列。 7.三维模型 目前随着计算机技术的飞速发展和计算机图形学理论的日趋完善, GIS 作为一门新兴的 边缘学科也日趋成熟,许多商品化的 GIS 软件功能日趋完善。但是,绝大多数的商品化 GIS 软件包还只是在二维平面的基础上模拟并处理现实世界上所遇到的现象和问题,而一旦涉及 到处理三维问题时,往往感到力不从心, GIS 处理的与地球有关的数据,即通常所说的空间 数据,从本质上说是三维连续分布的。从事关于地质、地球物理、气象、水文、采矿、地下 水、灾害、污染等方面的自然现象是三维的,当这些领域的科学家试图以二维系统来描述它 们时,就不能够精确地反映、分析或显示有关信息。三维 GIS 的要求与二维 GIS 相似,但 在数据采集、系统维护和界面设计等方面比二维 GIS 要复杂得多。 7. 1 三维 GIS 的功能 目前,三维 GIS 所研究的内容以及实现的功能主要包括: 1)数据编码 :是采集三维数据和对其进行有效性检查的工具,有效性检查将随着数据 的自然属性、表示方法和精度水平的不同而不同。 2)数据的组织和重构 :这包括对三维数据的拓扑描述以及一种表示法到另一种表示法 的转换(如从矢量的边界表示转换为栅格的八叉树表示)。 3)变换 :既能对所有物体或某一类物体,又能对某个物体进行平移、旋转、剪裁、比 例缩放等变换。另外还可以将一个物体分解成几个以及将几个物体组合成一个。 4)查询 :此功能依赖于单个物体的内在性质(如位置、形状、组成)和不同物体间的 关系(如连接、相交、形状相似或构成相似)。 5)逻辑运算:通过与、或、非及异或运算符对物体进行组合运算。 6)计算:计算物体的体积、表面积、中心、物体之间的距离及交角等。 7)分析:如计算某一类地物的分布趋势,或其它指标,以及进行模型的比较。 8)建立模型。 9)视觉变换 :在用户选择的任何视点,以用户确定的视角、比例因子、符号来表示所 有地物或某些指定物体。 10)系统维护:包括数据的自动备份、安全性措施、以及网络工作管理。 7. 2 三维数据结构 三维数据结构同二维一样,也存在栅格和矢量两种形式。栅格结构使用空间索引系统, 它包括将地理实体的三维空间分成细小的单元,称之为体元或体元素。存储这种数据的最简 单形式是采用三维行程编码,它是二维行程编码在三维空间的扩充。这种编码方法可能需要 大量的存储空间,更为复杂的技术是八叉树,它是二维的四叉树的延伸。三维矢量数据结构 表示有多种方法,其中运用最普遍的是具有拓扑关系的三维边界表示法和八叉树表示法。 7. 2. 1 八叉树三维数据结构 用八叉树来表示三维形体,既可以看成是四叉树方法在三维空间的推广,也可以是用三 维体素列阵表示形体方法的一种改进。八叉树的逻辑结构如下:假设要表示的形体 V 可以 放在一个充分大的正方体 C 内, C 的边长为 2 的 n 次方,形体 VC,它的八叉树可以用以下 的递归方法来定义:八叉树的每个节点与 C 的一个子立方体对应,树根与 C 本身相对应, 如果 V=C,那么 V 的八叉树仅有树根,如果 V 不等于 C,则 C 等分为八个子立方体,每个 子立方体与树根的一个子节点相对应。只要某个子立方体不是完全空白或完全为 V 所占据, 就要被八等分,从而对应的节点也就有了八个子节点。这样的递归判断、分割一直要进行到 结点所对应的立方体或是完全空白,或者是完全为 V 占据,或是其大小已是预先定义的体 素大小,并且对它与 V 之交作一定的“舍入”,使体素或认为是空白的,或认为是 V 占据的。 如此所生成的八叉树上的节点可分为三类: 1)灰节点,对应的立方体部分地为 V 所占据; 2)白节点,所对应的立方体中无 V 的内容; 3) 黑节点,所对应的立方体全为 V 所占据。 后两类 又称 为叶 结点 。 由 于八叉 树的 结构 与四 叉树 的结构 是非 常相 似的 , 所 以八叉 树的 存储结 构方 式可 以完 全沿 用四叉 树的 有关 方法 。 根 据不同 的存 储方 式, 八叉 树也可 以分 别称 为常规的、线形的、一对八的八叉树等等。 1)规则的八叉树 八叉树 的存 储结 构是 用一 个有九 个字 段的 记录 来表 示树中 的每 个结 点 , 其 中 一 个字段 用 来描述 该结 点的 特性 , 其 余的八 段用 来作 为存 放指 向其八 个子 结点 的指 针。 这是最 普通 使用 的表示 树形 数据 的存 储结 构方式 。 规 则八 叉树 缺陷 较多, 最大 的问 题是 指针 占用了 大量 的空 间。因此,这种方式虽然十分自然,容易掌握,但在存储空间的使用率方面不很理想。 2)线形八叉树 线形八 叉树 注重 考虑 如何 提高空 间利 用率 , 用 某一 预先确 定的 次序 遍历 八叉 树, 将 八 叉 树转换 成一 贯线 形表 , 表 的每个 元素 与一 个结 点相 对应 。 线 形八 叉树不 仅节 省存储 空间 , 对 某些运 算也 较为 方便 。 但 是为此 付出 的代 价是 丧失 了一定 的灵 活性 , 如 图 3-18 和图 3-19 所 示。 图 3-18:体元形式的三维数据 图 3-19:图 3-18 的线性八叉树编码 3)一对八式的八叉树 一个非 叶结 点有 八个 子节 点, 为 了 确 定 起 见 , 将 它 们分别 标记 为 0, 1, 2, 3, 4, 5, 6, 7。从上 面的介 绍可 以看到 ,如果 一个记 录与一 个结 点相对 应,那 么在这 个记 录中描 述的是 这个结 点的 八个 子结 点的 特征值 。 而 指针 给出 的则 是该八 个子 结点 所对 应记 录的存 放处 , 而 且还隐 含地 假设 了这 些子 结点记 录存 放的 次序 。 也 就是说 , 即 使 某个记 录是 不必要 的 , 那 么 相应的 存储 位置 也必 须空 闲在那 里, 以保 证不 会错 误地存 取到 其它 同辈 结点 的记录 。 这 样当 然会有 一定 的浪 费, 除非 它是完 全的 八叉 树, 即所 有的叶 结点 均在 同一 层次 出现 , 而 在该 层 次之上 的所 有层 中的 结点 均为非 结点 。 为了克 服这 种缺陷 , 一 是 增加计 算量 , 即 在存 取相 应 结点记 录之 前 , 首先 检查 它的父 结点 记录 , 看 一下 之前有 几个 叶结 点, 从而 可以知 道应 该 如 何存取 所需 结点 记录 。 这 种方法 的存 储需 求无 疑是 最小的 , 但 是 要增加 计算 量; 另一 个是 在 记录中 增加 一定 的信 息, 使计算 工作 适当 减少 或者 更方便 。例 如在 原记 录中 增加三 个字 节 , 一分为 八, 每个 子结 点对 应三位 , 代 表它 的子 结点 在指针 指向 区域 中的 偏移 。 因 此 , 要 找 到 它的子结点的记录位置,只要固定地把指针指向的位置加上这个偏移值( 0-7)乘上记录 所 占的字节数,就是所要的记录位置,因而一个结点的描述记录为: 偏移 指针 SWB SWT NWB NWT SEB SET NEB NET 用这种方式所得到的八叉树和以前相同,只是每个记录前多了三个字节。 7. 2. 2 三维数据的显示 三维显 示通 常采 用截 面图 、 等 距平 面、 多层 平面 和 立体块 状图 等多 种表 现形 式, 大多 数 三维显 示技 术局 限于 CRT 屏幕和 绘图 纸的 二维 表现 形式, 人们 可以 观察 到地 理现象 的三 维 形状, 但不 能将 它们 作为 离散的 实体 进行 分析 , 如 立体不 能被 测量 、 拉 伸、 改 变形状 或组 合。 借助三 维显 示技 术, 通过 离散的 高程 点形 成等 高线 图、 截 面 图 、 多 层 平 面 和 透视图 , 可 以把 这些最 初都 是人 工完 成的 工作, 用各 种计 算机 程序 迅速高 效地 完成 。图 3-20 给出了 一种 三 维数据的表示方法。 图 3-20:通过“围墙”状的剖面表示三维数据 如今我在什么地方?我不知道那是什么地方。 我猜不着。 到底这里是哪里?映入我 眼帘的只是不知何处去的人蔓,行色匆匆地从我身边走过去。 村上春树 第四章 空间参照系统和地图投影 导读:正如上一章所描述的,一个要素要进行定位,必须嵌入到一个空间参照系中, 因为GIS所描述是位于地球表面的信息,所以根据地球椭球体建立的地理坐标(经 纬网)可以作为所有要素的参照系统。因为地球是一个不规则的球体,为了能够将 其表面的内容显示在平面的显示器或纸面上,必须进行坐标变换。 本章讲述了地球椭球体参数、常见的投影类型。考虑到目前使用的1:100万以上地 形图都是采用高斯——克吕格投影,本章最后又对该种投影类型和相关的地形图分 幅标准做了简单介绍。 1.地球椭球体基本要素 1.1地球椭球体 1. 1. 1 地球的形状 为了从数学上定义地球,必须建立一个地球表面的几何模型。这个模型由地球的形状决 定的。它是一个较为接近地球形状的几何模型,即椭球体,是由一个椭圆绕着其短轴旋转而 成。 地球自然表面是一个起伏不平、十分不规则的表面,有高山、丘陵和平原,又有江河湖 海。地球表面约有 71%的面积为海洋所占用, 29%的面积是大陆与岛屿。陆地上最高点与海 洋中最深处相差近 20 公里。这个高低不平的表面无法用数学公式表达,也无法进行运算。 所以在量测与制图时,必须找一个规则的曲面来代替地球的自然表面。当海洋静止时,它的 自由水面必定与该面上各点的重力方向(铅垂线方向)成正交,我们把这个面叫做水准面。 但水准面有无数多个,其中有一个与静止的平均海水面相重合。可以设想这个静止的平均海 水面穿过大陆和岛屿形成一个闭合的曲面,这就是大地水准面(图 4-1)。 图 4-1:大地水准面 大地水准面所包围的形体,叫大地球体。由于地球体内部质量分布的不均匀,引起重力 方向的变化,导致处处和重力方向成正交的大地水准面成为一个不规则的,仍然是不能用数 学表达的曲面。大地水准面形状虽然十分复杂,但从整体来看,起伏是微小的。它是一个很 接近于绕自转轴(短轴)旋转的椭球体。所以在测量和制图中就用旋转椭球来代替大地球体, 这个旋转球体通常称地球椭球体,简称椭球体。 1. 1. 2 地球的大小 关于地球椭球体的大小,由于采用不同的资料推算,椭球体的元素值是不同的。现将世 界各国常用的地球椭球体的数据列表如下: 表 4-1:各种地球椭球体模型 椭球体名称 年代 长半轴(米) 短半轴(米) 扁率 白塞尔(Bessel) 1841 6377397 6356079 1:299.15 克拉克(Clarke) 1880 6378249 6356515 1:293.5 克拉克(Clarke) 1866 6378206 6356584 1:295.0 海福特(Hayford) 1910 6378388 6356912 1:297 克拉索夫斯基 1940 6378245 6356863 1:298.3 I.U .G .G 1967 6378160 6356775 1:298.25 埃维尔斯特(Everest) 1830 6377276 6356075 1:300.8 1. 1. 3 椭球体的半径 地球椭球体表面是一个规则的数学表面。椭球体的大小,通常用两个半径:长半径 a 和 短半径 b,或由一个半径和扁率来决定。扁率 α 表示椭球的扁平程度。扁率的计算公式为: α=(a-b)/a 。这些地球椭球体的基本元素 a、 b、α 等,由于推求它的年代、使用的方法 以及测定的地区不同,其结果并不一致,故地球椭球体的参数值有很多种。中国在 1952 年 以前采用海福特(Hayford )椭球体,从 1953-1980 年采用克拉索夫斯基椭球体。随着人造 地球卫星的发射,有了更精密的测算地球形体的条件。 1975 年第 16 届国际大地测量及地球 物理联合会上通过国际大地测量协会第一号决议中公布的地球椭球体,称为 GRS(1975 ), 中国自 1980 年开始采用 GRS(1975 )新参考椭球体系。由于地球椭球长半径与短半径的差 值很小,所以当制作小比例尺地图时,往往把它当作球体看待,这个球体的半径为 6371 公 里。 1. 1. 4 高程 地面点到大地水准面的高程,称为绝对高程。如图 2 所示, P 0 P 0 '为大地水准面,地面点 A和B到P 0 P 0 '的垂直距离H A 和H B 为A 、 B两点的绝对高程。地面点到任一水准面的高程,称为 相对高程。如图 2 中, A、 B两点至任一水准面P B 1 P 1 '的垂直距离H A '和H B B'为A 、 B两点的相对 高程。 图 4-2:地面点的高程 我国的大地控制网 我国面积辽阔,在约 960 万平方公里的土地上进行测图工作,需要分成若干单元测区, 而且测量的精度又要符合统一要求,为此,在全国范围内建立统一的大地控制网。控制网分 为平面控制网和高程控制网。 大地坐标:在地面上建立一系列相连接的三角形,量取一段精确的距离作为起算边,在 这个边的两端点,采用天文观测的方法确定其点位(经度、纬度和方位角),用精密测角仪 器测定各三角形的角值,根据起算边的边长和点位,就可以推算出其他各点的坐标。这样推 算出的坐标,称为大地坐标。 我国 1954 年在北京设立了大地坐标原点,由此计算出来的各大地控制点的坐标,称为 1954年北京坐标系。我国 1986年宣布在陕西省泾阳县设立了新的大地坐标原点,并采用 1975 年国际大地测量协会推荐的大地参考椭球体,由此计算出来的各大地控制点坐标,称为 1980 年大地坐标系。 我国高程的起算面是黄海平均海水面。1956 年在青岛设立了水准原点,其他各控制点 的绝对高程都是根据青岛水准原点推算的,称此为 1956 年黄海高程系。 1987 年国家测绘局 公布:中国的高程基准面启用《1985 国家高程基准》取代国务院 1959 年批准启用的《黄海 平均海水面》。 《1985 国家高程基准》比《黄海平均海水面》上升 29 毫米。 1.2地图比例尺 1. 2. 1 比例尺表示法 地图比例尺通常认为是地图上距离与地面上相应距离之比。地图比例尺可用下述方法表 示。 1)数字比例尺 这是简单的分数或比例,可表示为 1:1000000 或 1/1000000,最好用前者。这意味着, 地图上(沿特定线)长度 1 毫米、1 厘米或 1 英寸(分子),代表地球表面上的 1000000 毫 米、厘米或英寸(分母)。 2)文字比例尺 这是图上距离与实地距离之间关系的描述。例如,1 :1000000 这一数字比例尺可描述 为“图 1 毫米等于实地 1 公里”。 3)图解比例尺或直线比例尺 这是在地图上绘出的直线段,常常绘于图例方框中或图廓下方,表示图上长度相当于实 地距离的单位。 4)面积比例尺 这关系到图上面积与实地面积之比,表示图上 1 单位面积(平方厘米)与实地上同一种 平方单位的特定数量之比。 1. 2. 2 比例系数 表明确定的比例尺与实际比例尺数值之间的关系叫做比例系数(SF)。可以这样理解比 例系数,首先将地球缩小为所选比例尺的地球仪地图;然后将该球形地图转换为平面地图。 上述平面地图的数字比例尺就是地球仪的比例尺,叫做主比例尺(或名义比例尺);真实比 例尺就是平面地图上的实际比例尺,当然各处是不相同的。 比例系数可按下式计算:SF= 实际比例尺/ 主比例尺 该公式表明,比例系数是实际比例尺与单位(1 )主比例尺之比。当比例系数为 2 时,实际 比例尺为主比例尺的两倍。比例系数只在小比例尺世界地图上比较明显。在大比例尺地图上, 各处的比例系数对于 1 只有很小的变化。 2.坐标系 所谓坐标系,包含两方面的内容:一是在把大地水准面上的测量成果化算到椭球体面上 的计算工作中,所采用的椭球的大小;二是椭球体与大地水准面的相关位置不同,对同一点 的地理坐标所计算的结果将有不同的值。因此,选定了一个一定大小的椭球体,并确定了它 与大地水准面的相关位置,就确定了一个坐标系(图 4-3)。 图 4-3:现实世界和坐标空间的联系 2.1地理坐标 地球除了绕太阳公转外,还绕着自己的轴线旋转,地球自转轴线与地球椭球体的短轴相 重合,并与地面相交于两点,这两点就是地球的两极,北极和南极。垂直于地轴,并通过地 心的平面叫赤道平面,赤道平面与地球表面相交的大圆圈(交线)叫赤道。平行于赤道的各 个圆圈叫纬圈(纬线)( Parallel),显然赤道是最大的一个纬圈。 通过地轴垂直于赤道面的平面叫做经面或子午圈( Meridian) ,所有的子午圈长度彼此 都相等。(图 4-4) 图 4-4:地球的经线和纬线 2. 1. 1 纬度( Latitude) 设椭球面上有一点 P(图 4-4) ,通过 P 点作椭球面的垂线,称之为过 P 点的法线。法线 与赤道面的交角,叫做 P 点的地理纬度(简称纬度),通常以字母 φ 表示。纬度从赤道起算, 在赤道上纬度为 0 度,纬线离赤道愈远,纬度愈大,至极点纬度为 90度。赤道以北叫北纬、 以南叫南纬。 2. 1. 2 经度( Longitude) 过 P 点的子午面与通过英国格林尼治天文台的子午面所夹的二面角,叫做 P 点的地理 经度(简称经度),通常用字母λ表示。国际规定通过英国格林尼治天文台的子午线为本初 子午线(或叫首子午线) ,作为计算经度的起点,该线的经度为 0 度,向东 0-180度叫东经, 向西 0-180度叫西经。 2. 1. 3 地面上点位的确定 地面上任一点的位置,通常用经度和纬度来决定。经线和纬线是地球表面上两组正交(相 交为 90 度)的曲线,这两组正交的曲线构成的坐标,称为地理坐标系。地表面某两点经度 值之差称为经差,某两点纬度值之差称为纬差。例如北京在地球上的位置可由北纬 39°56' 和东经 116°24'来确定。 2.2平面上的坐标系 地理坐标是一种球面坐标。由于地球表面是不可展开的曲面,也就是说曲面上的各点不 能直接表示在平面上,因此必须运用地图投影的方法,建立地球表面和平面上点的函数关系, 使地球表面上任一点由地理坐标 (φ、λ) 确定的点,在平面上必有一个与它相对应的点, 平面上任一点的位置可以用极坐标或直角坐标表示。 2. 2. 1 平面直角坐标系的建立 在平面上选一点 O 为直角坐标原点,过该点 O 作相互垂直的两轴 X’OX 和 Y’OY 而建立 平面直角坐标系,如图 5 所示。 直角坐标系中,规定 OX、OY 方向为正值, OX、OY 方向为负值,因此在坐标系中的一个 已知点 P,它的位置便可由该点对 OX 与 OY 轴的垂线长度唯一地确定,即 x=AP, y=BP,通常 记为 P(x,y) 。 2. 2. 2 平面极坐标系( Polar Coordinate)的建立 平面直角坐标系 O B P Y X A O X Y Y Q X P O' 平面极坐标系 ρδ X' Y' 图 4-5:平面直角坐标系和极坐标系 如图 5 所示,设 O’ 为极坐标原点, O’O 为极轴, P 是坐标系中的一个点,则 O’P 称 为极距,用符号 ρ 表示,即 ρ=O’P 。 ∠OO’P 为极角,用符号 δ 表示,则 ∠OO’P=δ 。极 角 δ 由极轴起算,按逆时针方向为正,顺时针方向为负。 极坐标与平面直角坐标之间可建立一定的关系式。由图 5 可知,直角坐标的 x 轴与极轴 重合,二坐标系原点间距离 OO’ 用 Q 表示,则有: X=Q–ρcosδ Y=ρsinδ 2.3直角坐标系的平移和旋转 2. 3. 1 坐标系平移 如图 4-6 所示,坐标系 XOY 与坐标系 X’O’Y’ 相应的坐标轴彼此平行,并且具有相同 的正向。坐标系 X’O’Y’ 是由坐标系 XOY 平行移动而得到的。设 P 点在坐标系 XOY 中的坐 标为 (x,y) ,在 X’O’Y’ 中坐标为 (x’,y’) ,而 (a,b) 是 O’ 在坐标系 XOY 中的坐标, 于是: x=x’+a y=y’+b 上式即一点在坐标系平移前后之坐标关系式。 O' O X Y X' Y'b a P 图 4-6:坐标平移 2. 3. 2 坐标系旋转 如图 4-7 所示,如坐标系 XOY 与坐标系 X’O’Y’ 的原点重合,且对应的两坐标轴夹角 为 θ ,坐标系 X’O’Y’ 是由坐标系 XOY 以 O 为中心逆时针旋转 θ 角后得到的。 x=x’cosθ+y’sinθ y=y’cosθ-x’sinθ 上式即为经过旋转θ角后的二直角坐标系中某一点坐标的关系式。 O X Y X' Y' P θ 图 4-7:坐标旋转 2. 3. 3 坐标系平移和旋转 如图 4-8 所示,坐标系 X’O’Y’ 的原点在坐标系 XOY 中的坐标为 a、b, X 轴与 X’ 轴 之夹角为θ。可以认为坐标系 X’O’Y’ 原是与坐标系 XOY重合,后因为 O’分别平移了 a、 b 之距离,并且坐标系二坐标轴 O’X’ 与 O’Y’ 又相对 OX 与 OY 逆时针旋转了 θ 角而得到 的。 在二坐标系之间引入一个辅助坐标系 X”O’Y” ,使它的二坐标轴 O’X” 与 O’Y” 分 别与 OX、 OY 平行。 在 X”O’Y” 系中有一点 P,其坐标为 (x”,y”) ,则由坐标系平移公式与坐标系旋转 公式可得: x=x”+a y=y”+b 故有 x”=x’cosθ+y’sinθ y”=y’cosθ-x’sinθ 即 x=x’cosθ+y’sinθ+a y”=y’cosθ-x’sinθ+b 上式即坐标系平移和旋转后新、旧坐标系中某一点坐标之关系式。 O X Y X' Y' P θ O' Y'' X'' 图 4-8:坐标平移和旋转 3.地图投影的基本问题 3.1地图投影的概念 在数学中,投影(Project )的含义是指建立两个点集间一一对应的映射关系。同样,在 地图学中,地图投影就是指建立地球表面上的点与投影平面上点之间的一一对应关系。地图 投影的基本问题就是利用一定的数学法则把地球表面上的经纬线网表示到平面上。凡是地理 信息系统就必然要考虑到地图投影,地图投影的使用保证了空间信息在地域上的联系和完整 性,在各类地理信息系统的建立过程中,选择适当的地图投影系统是首先要考虑的问题。由 于地球椭球体表面是曲面,而地图通常是要绘制在平面图纸上,因此制图时首先要把曲面展 为平面,然而球面是个不可展的曲面,即把它直接展为平面时,不可能不发生破裂或褶皱。 若用这种具有破裂或褶皱的平面绘制地图,显然是不实际的,所以必须采用特殊的方法将曲 面展开,使其成为没有破裂或褶皱的平面。 3.2地图投影的变形 3. 2. 1 变形的种类 地图投影的方法很多,用不同的投影方法得到的经纬线网形式不同。用地图投影的方法 将球面展为平面,虽然可以保持图形的完整和连续,但它们与球面上的经纬线网形状并不完 全相似。这表明投影之后,地图上的经纬线网发生了变形,因而根据地理坐标展绘在地图上 的各种地面事物,也必然随之发生变形。这种变形使地面事物的几何特性(长度、方向、面 积)受到破坏。把地图上的经纬线网与地球仪上的经纬线网进行比较,可以发现变形表现在 长度、面积和角度三个方面,分别用长度比、面积比的变化显示投影中长度变形和面积变形。 如果长度变形或面积变形为零,则没有长度变形或没有面积变形。角度变形即某一角度投影 后角值与它在地球表面上固有角值之差。 1)长度变形 即地图上的经纬线长度与地球仪上的经纬线长度特点并不完全相同,地图上的经纬线长 度并非都是按照同一比例缩小的,这表明地图上具有长度变形。 在地球仪上经纬线的长度具有下列特点:第一,纬线长度不等,其中赤道最长,纬度越 高,纬线越短,极地的纬线长度为零;第二,在同一条纬线上,经差相同的纬线弧长相等; 第三,所有的经线长度都相等。长度变形的情况因投影而异。在同一投影上,长度变形不仅 随地点而改变,在同一点上还因方向不同而不同。 2)面积变形 即由于地图上经纬线网格面积与地球仪经纬线网格面积的特点不同,在地图上经纬线网 格面积不是按照同一比例缩小的,这表明地图上具有面积变形。 在地球仪上经纬线网格的面积具有下列特点:第一,在同一纬度带内,经差相同的网络 面积相等。第二,在同一经度带内,纬线越高,网络面积越小。然而地图上却并非完全如此。 如在图 4-9-a 上,同一纬度带内,纬差相等的网格面积相等,这些面积不是按照同一比例缩 小的。纬度越高,面积比例越大。在图 4-9-b 上,同一纬度带内,经差相同的网格面积不等, 这表明面积比例随经度的变化而变化了。由于地图上经纬线网格面积与地球仪上经纬线网格 面积的特点不同,在地图上经纬线网格面积不是按照同一比例缩小的,这表明地图上具有面 积变形。面积变形的情况因投影而异。在同一投影上,面积变形因地点的不同而不同。 3)角度变形 是指地图上两条所夹的角度不等于球面上相应的角度,如在图 4-9-b 和图 4-9-c 上,只有 中央经线和各纬线相交成直角,其余的经线和纬线均不呈直角相交,而在地球仪上经线和纬 线处处都呈直角相交,这表明地图上有了角度变形。角度变形的情况因投影而异。在同一投 影图上,角度变形因地点而变。 地图投影的变形随地点的改变而改变,因此在一幅地图上,就很难笼统地说它有什么变 形,变形有多大。 图 4-9:地图投影变形 3. 2. 2 变形椭圆 变形椭圆是显示变形的几何图形,从图 4-9 可以看到,实地上同样大小的经纬线在投影 面上变成形状和大小都不相同的图形(比较图 4-9 中三个格网)。实际中每种投影的变形各 不相同,通过考察地球表面上一个微小的圆形(称为微分圆)在投影中的表象——变形椭圆 的形状和大小,就可以反映出投影中变形的差异(图 4-10)。 图 4-10:微分圆表示投影变形 3.3地图投影的分类 地图投影的种类很多,为了学习和研究的方便,应对其进行分类。由于分类的标志不同, 分类方法就不同。从使用地图的角度出发,需要了解下述几种分类。 3. 3. 1 按变形性质分类 按变形性质地图投影可以分为三类:等角投影、等积投影和任意投影。 1)等角投影 定义为任何点上二微分线段组成的角度投影前后保持不变,亦即投影前后对应的微分面 积保持图形相似,故可称为正形投影。投影面上某点的任意两方向线夹角与椭球面上相应两 线段夹角相等,即角度变形为零。等角投影在一点上任意方向的长度比都相等,但在不同地 点长度比是不同的,即不同地点上的变形椭圆大小不同。 2)等积投影 定义为某一微分面积投影前后保持相等,亦即其面积比为 1,即在投影平面上任意一块 面积与椭球面上相应的面积相等,即面积变形等于零。 3)等距投影 在任意投影上,长度、面积和角度都有变形,它既不等角又不等积。但是在任意投影中, 有一种比较常见的等距投影,定义为沿某一特定方向的距离,投影前后保持不变,即沿着该 特定方向长度比为 1。在这种投影图上并不是不存在长度变形,它只是在特定方向上没有长 度变形。等距投影的面积变形小于等角投影,角度变形小于等积投影。任意投影多用于要求 面积变形不大、角度变形也不大的地图,如一般参考用图和教学地图。经过投影后地图上所 产生的长度变形、面积变形和角度变形,是相互联系相互影响的。它们之间的关系是:在等 积投影上不能保持等角特性,在等角投影上不能保持等积特性;在任意投影上不能保持等角 和等积的特性;等积投影的形状变形比较大,等角投影的面积变形比较大。 3. 3. 2 按构成方法分类 地图投影最初建立在透视的几何原理上,它是把椭球面直接透视到平面上,或透视到可 展开的曲面上,如圆柱面和圆锥面。圆柱面和圆锥面虽然不是平面,但可以展为平面。这样 就得到具有几何意义的方位、圆柱和圆锥投影。随着科学的发展,为了使地图上变形尽量减 小,或者为了使地图满足某些特定要求,地图投影就逐渐跳出了原来借助于几何面构成投影 的框子,而产生了一系列按照数学条件构成的投影。因此,按照构成方法,可以把地图投影 分为两大类:几何投影和非几何投影。 1)几何投影 几何投影是把椭球面上的经纬线网投影到几何面上,然后将几何面展为平面而得到。根 据几何面的形状,可以进一步分为下述几类(图 4-11): (1 . 1) 方位投影:以平面作为投影面,使平面与球面相切或相割,将球面上的经纬线 投影到平面上而成。 (1 . 2) 圆柱投影:以圆柱面作为投影面,使圆柱面与球面相切或相割,将球面上的经 纬线投影到圆柱面上,然后将圆柱面展为平面而成。 (1 . 3) 圆锥投影:以圆锥面作为投影面,使圆锥面与球面相切或相割,将球面上的经 纬线投影到圆锥面上,然后将圆锥面展为平面而成。这里,我们可将方位投影看作圆锥投影 的一种特殊情况,假设当圆锥顶角扩大到 180 度时,这圆锥面就成为一个平面,再将地球椭 球体上的经纬线投影到此平面上。圆柱投影,从几何定义上讲,也是圆锥投影的一个特殊情 况,设想圆锥顶点延伸到无穷远时,即成为一个圆柱。 图 4-11:各种几何投影 2)非几何投影 不借助几何面,根据某些条件用数学解析法确定球面与平面之间点与点的函数关系。在 这类投影中,一般按经纬线形状又分为下述几类: (2 . 1) 伪方位投影:纬线为同心圆,中央经线为直线,其余的经线均为对称于中央经 线的曲线,且相交于纬线的共同圆心。 (2 . 2) 伪圆柱投影:纬线为平行直线,中央经线为直线,其余的经线均为对称于中央 经线的曲线。 (2 . 3) 伪圆锥投影:纬线为同心圆弧,中央经线为直线,其余经线均为对称于中央经 线的曲线。 (2 .4 ) 多圆锥投影 :纬线为同周圆弧,其圆心均为于中央经线上,中央经线为直线, 其余的经线均为对称于中央经线的曲线。 3. 3. 3 按照投影面积与地球相割或相切分类 1)割投影 以平面、圆柱面或圆锥面作为投影面,使投影面与球面相割,将球面上的经纬线投影到 平面上、圆柱面上或圆锥面上,然后将该投影面展为平面而成。 2)切投影 以平面、圆柱面或圆锥面作为投影面,使投影面与球面相切,将球面上的经纬线投影到 平面上、圆柱面上或圆锥面上,然后将该投影面展为平面而成。 3.4地图投影的选择 地图投影选择得是否恰当,直接影响地图的精度和使用价值。这里所讲的地图投影选择, 主要指中、小比例尺地图,不包括国家基本比例尺地形图。因为国家基本比例尺地形图的投 影、分幅等,是由国家测绘主管部门研究制订 * ,不容许任意改变的,另外编制小区域大比 例尺地图,无论采用什么投影,变形都是很小的。 选择制图投影时,主要要考虑以下因素:制图区域的范围、形状和地理位置,地图的用 途、出版方式及其他特殊要求等,其中制图区域的范围、形状和地理位置是主要因素。 对于世界地图,常用的主要是正圆柱、伪圆柱和多圆锥投影。在世界地图中常用墨卡托 投影绘制世界航线图、世界交通图与世界时区图; 我国出版的世界地图多采用等差分纬线多圆锥投影,选用这个投影,对于表现中国形状 以及与四邻的对比关系较好,但投影的边缘地区变形较大。 对于半球地图,东、西半球图常选用横轴方位投影;南、北半球图常选用正轴方位投影; 水、陆半球图一般选用斜轴方位投影。 对于其他的中、小范围的投影选择,须考虑到它的轮廓形状和地理位置,最好是使等变 形线与制图区域的轮廓形状基本一致,以便减少图上变形。因此,圆形地区一般适于采用方 位投影,在两极附近则采用正轴方位投影,以赤道为中心的地区采用横轴方位投影,在中纬 度地区采用斜轴方位投影。在东西延伸的中纬度地区,一般多采用正轴圆锥投影,如中国与 美国。在赤道两侧东西延伸的地区,则宜采用正轴圆柱投影,如印度尼西亚。在南北方向延 伸的地区,一般采用横轴圆柱投影和多圆锥投影,如智利与阿根廷。 3.5常用的一些地图投影 3. 5. 1 世界地图的投影 世界地图的投影主要考虑要保证全球整体变形不大,根据不同的要求,需要具有等角或 等积性质,主要包括:等差分纬线多圆锥投影、正切差分纬线多圆锥投影(1976 年方案)、 任意伪圆柱投影、正轴等角割圆柱投影。 3. 5. 2 半球地图的投影 东、西半球有横轴等面积方位投影、横轴等角方位投影;南、北半球有正轴等面积方位 投影、正轴等角方位投影、正轴等距离方位投影。 3. 5. 3 各大洲地图投影 1)亚洲地图的投影:斜轴等面积方位投影、彭纳投影。 2)欧洲地图的投影:斜轴等面积方位投影、正轴等角圆锥投影。 3)北美洲地图的投影:斜轴等面积方位投影、彭纳投影。 * 目前我国采用的就是后面提及的高斯——克吕格投影及分幅方案。 4)南美洲地图的投影:斜轴等面积方位投影、桑逊投影。 5)澳洲地图的投影:斜轴等面积方位投影、正轴等角圆锥投影。 6)拉丁美洲地图的投影:斜轴等面积方位投影。 3. 5. 4 中国各种地图投影 1)中国全国地图投影:斜轴等面积方位投影、斜轴等角方位投影、彭纳投影、伪方位 投影、正轴等面积割圆锥投影、正轴等角割圆锥投影。 2)中国分省(区)地图的投影:正轴等角割圆锥投影、正轴等面积割圆锥投影、正轴 等角圆柱投影、高斯- 克吕格投影(宽带)。 3)中国大比例尺地图的投影:多面体投影(北洋军阀时期)、等角割圆锥投影(兰勃特 投影)(解放前)、高斯- 克吕格投影(解放以后)。 4.高斯——克吕格投影 由于这个投影是由德国数学家、物理学家、天文学家高斯于 19 世纪 20 年代拟定,后经 德国大地测量学家克吕格于 1912 年对投影公式加以补充,故称为高斯——克吕格投影。 高斯——克吕格投影在英美国家称为横轴墨卡托投影。美国编制世界各地军用地图和地 球资源卫星象片所采用的全球横轴墨卡托投影(UTM )是横轴墨卡托投影的一种变型。高 斯克吕格投影的中央经线长度比等于 1,UTM 投影规定中央经线长度比为 0.9996。在 6 度 带内最大长度变形不超过 0.04%。 高斯克吕格投影的中央经线和赤道为互相垂直的直线,其他经线均为凹向并对称于中央 经线的曲线,其他纬线均为以赤道为对称轴的向两极弯曲的曲线,经纬线成直角相交。在这 个投影上,角度没有变形。中央经线长度比等于 1,没有长度变形,其余经线长度比均大于 1,长度变形为正,距中央经线愈远变形愈大,最大变形在边缘经线与赤道的交点上;面积 变形也是距中央经线愈远,变形愈大。为了保证地图的精度,采用分带投影方法,即将投影 范围的东西界加以限制,使其变形不超过一定的限度,这样把许多带结合起来,可成为整个 区域的投影(图 4-12)。高斯——克吕格投影的变形特征是:在同一条经线上,长度变形随 纬度的降低而增大,在赤道处为最大;在同一条纬线上,长度变形随经差的增加而增大,且 增大速度较快。在 6 度带范围内,长度最大变形不超过 0.14%。 图 12:高斯——克吕格投影示意 我国规定 1: 1 万、1 : 2.5 万、1 :5 万、 1:10 万、 1:25 万、1 :50 万比例尺地形图, 均采用高斯克吕格投影。1 :2.5 至 1:50 万比例尺地形图采用经差 6 度分带,1 :1 万比例 尺地形图采用经差 3 度分带。 6 度带是从 0 度子午线起,自西向东每隔经差 6 为一投影带,全球分为 60 带,各带的 带号用自然序数 1, 2, 3, …60 表示。即以东经 0-6 为第 1 带,其中央经线为 3E,东经 6-12 为第 2 带,其中央经线为 9E,其余类推(图 4-13)。 3 度带,是从东经 1 度 30 分的经线开始,每隔 3 度为一带,全球划分为 120 个投影带。 图 4-13 表示出 6 度带与 3 度带的中央经线与带号的关系。 在高斯克吕格投影上,规定以中央经线为 X 轴,赤道为 Y 轴,两轴的交点为坐标原点。 图 13:高斯——克吕格投影的分带 X 坐标值在赤道以北为正,以南为负; Y 坐标值在中央经线以东为正,以西为负。我国 在北半球, X 坐标皆为正值。 Y 坐标在中央经线以西为负值,运用起来很不方便。为了避免 Y 坐标出现负值,将各带的坐标纵轴西移 500 公里,即将所有 Y 值都加 500 公里。 由于采用了分带方法,各带的投影完全相同,某一坐标值 ( x, y) ,在每一投影带中均 有一个,在全球则有 60 个同样的坐标值,不能确切表示该点的位置。因此,在 Y 值前,需 冠以带号,这样的坐标称为通用坐标。 高斯克吕格投影各带是按相同经差划分的,只要计算出一带各点的坐标,其余各带都是 适用的。这个投影的坐标值由国家测绘部门根据地形图比例尺系列,事先计算制成坐标表, 供作业单位使用。 5.地形图的分幅和编号 国家基本比例尺地形图有 1:1 万、 1:2.5 万、1 :5 万、1 : 10 万、1 : 20 万、1 :50 万和 1:100 万七种。普通地图通常按比例尺分为大、中、小三种,一般以 1:10 万和更大 比例尺的地图称为大比例尺地图;1 :10 万至 1:100 万的称为中比例尺地图;小于 1:100 万的称为小比例尺地图。对于一个国家或世界范围来讲,测制成套的各种比例尺地形图时, 分幅编号尤其必要。通常这是由国家主管部门制定统一的图幅分幅和编号系统。 5.1地形图的分幅 目前,我国采用的地形图分幅方案,是以 1:100 万地形图为基准,按照相同的经差和 纬差定义更大比例尺地形图的分幅。百万分之一地图在纬度 0 o —60 o 之间的图幅,图幅大小 按经差 6 o ,纬差 4 o 分幅;在 60 o —76 o 之间的图幅,其经差为 12 o ,纬差为 4 o ;在 76 o —80 o 之 间图幅的经差为 24 o ,纬差为 4 o ,所以各幅百万分之一地图都是经差 6 o ,纬差 4 o 分幅的。 每幅百万分之一内各级较大比例尺地形图的划分,按规定的相应经纬差进行,其中, 1: 50 万、 1: 20 万、 1: 10 万三种比例尺地形图,以百万分之一地图为基础直接划分。一幅百 万分之一地形图划分四幅 1:50 万地形图,每幅为经差 3 o ,纬差 2 o ;一幅百万分之一地图 划分为 36 幅 1:20 万地形图,每幅为经差 1 o ,纬差 40’;一幅百万分之一地图划分 144 幅 1:10 万地形图,每幅为经差 30 ’,纬差 20 ’。 每幅大于 1:10 万比例尺的地形图,则以 1:10万图为基础进行逐级划分,一幅 1:10 万地形图划分四幅 1:5万地形图;一幅 1:5 万地形图划分为四幅 1:2.5 万地形图。在 1: 10 万图的基础上划分为 64 幅1:1 万地形图;一幅 1:1 万地形图又划分为 4 幅1:5000 地 形图, (见表4-1) 。 表 4-1:基本比例尺地形图的图幅大小及其图幅间的数量关系。 图幅大小 比例尺 (万) 经度 纬度 图幅间的数量关系 1:100 6 度 4 度 1 1:50 3 度 2 度 4 1 1:20 1 度 40 分 36 9 1 1:10 30分 20分 144 36 4 1 1:5 15 分 10 分 576 144 16 4 1 1:2.5 7.5 分 5 分 2304 576 64 16 4 1 1:1 3 分45 秒 2.5 分 9216 2304 256 64 16 4 5.2分幅编号 地形图的编号是根据各种比例尺地形图的分幅,对每一幅地图给予一个固定的号码,这 种号码不能重复出现,并要保持一定的系统性。 地形图编号的最基本的方法是采用行列法,即把每幅图所在一定范围内的行数和列数组 成一个号码。 5. 2. 1 1: 100 万地图的编号 该种地形图的编号为全球统一分幅编号。 列数:由赤道起向南北两极每隔纬差 4 o 为一列,直到南北 88 o (南北纬 88 o 至南北两极 地区,采用极方位投影单独成图), 将南北半球各划分为 22 列, 分别用拉丁字母A、 B、C、 D……V 表示。 行数:从经度 180 o 起向东每隔 6 o 为一行,绕地球一周共有 60 行,分别以数字 1、2、3、 4……60 表示。 由于南北两半球的经度相同,规定在南半球的图号前加一个 S,北半球的图号前不加任 何符号。一般来讲,把列数的字母写在前,行数的数字写在后,中间用一条短线连接。例如 北京所在的一幅百万分之一地图的编号为 J-50(如图 14 所示) 。 由于地球的经线向两极收敛,随着纬度的增加,同是 6 o 的经差但其纬线弧长已逐渐缩 小, 因此规定在纬度60 o -76 o 间的图幅采用双幅合并 (经差为12 o ,纬差为4 o ); 在纬度76 o -88 o 间的图幅采用四幅合并(经差为 24 o ,纬差为 4 o )。这些合并图幅的编号,列数不变,行数 (无论包含两个或四个)并列写在其后。例如北纬 80 o -84 o ,西经 48 o -72 o 的一幅百万分之一 的地图编号应为U-19、20、21、22(图 4-14) 。 图 14: 100 万地形图的分幅和编号(北半球) 5. 2. 2 1: 50 万、1 : 20 万、1 : 10 万地形图的编号 一幅 1:100 万地图划分四幅 1:50 万地图,分别用甲、乙、丙、丁表示,其编号是在 1:100 万地形图的编号后加上它本身的序号,如 J-50-乙。 一幅 1:100 万地图划 36 幅 1:20 万地图,分别用带括号的数字(1 )—(36)表示, 其编号是在 1:100 万地形图的编号后加上它本身的序号,如 J-50-(28 )。 一幅 1: 100 万地图划分 144 幅 1: 10 万地图,分别用数字 1—144 表示,其编号是在 1: 100 万地形图的编号后加上它本身的序号,如 J-50-32。(图 4-15) 图 15: 1:50 万、1 : 20 万、1 :10 万地形图的分幅和编号示例 5. 2. 3 1: 5 万、 1: 2.5 万、 1: 1 万地形图的编号 以 1:10 万地形图的编号为基础,将一幅 1:10 万地图划分四幅 1:5 万地图,分别用 甲、乙、丙、丁表示,其编号是在 1: 10 万地形图的编号后加上它本身的序号,如 J-50-32- 甲。再将一幅 1:5 万地图划分四幅 1:2.5 万地形图,分别用 1、2 、3 、 4 表示,其编号是 在 1: 5 万地形图的编号后加上它本身的序号,如 J-50-32-甲-1 。 1:1 万地形图的编号,是以一幅 1:10 万地形图划分为 64 幅 1:1 万地形图,分别以 带括号的(1 )—(64)表示,其编号是在 1: 10 万图号后加上 1: 1 万地图的序号,如 J-50-32- (10 )。 一幅 1: 1 万地形图划分为 4 幅 1: 5000 地形图,分别用小写拉丁字母 a、 b、 c、 d 表示, 其编号是在 1:1 万图号后加上它本身的序号,如 J-50-32-( 10)-a 。 0(0),1(1),2(10),3(11),4(100),5(101),6(110),7(111),8(1000),9(1001)… 阿拉伯数字及其二级制表示 第五章 GIS 中的数据 导读:对空间数据的处理是GIS的核心功能,GIS中的数据通常描述三部分信息: 空间信息(位置,空间关系等等),非空间的属性信息,时间信息。数据按照其测量 尺度,可以分为定名、定比、间隔、比率量四种类型。由于各方面的原因,GIS数 据存在着质量问题,了解数据质量有利于数据的正确使用,避免出现“Garbage In, Garbage Out”的情形。数据质量可以通过元数据进行描述,简单的说,元数据是对 数据的描述,在GIS应用不断发展、空间数据不断增长的情况下,元数据有助于数 据的共享和有效使用。 本章讲述了上述的内容。 1.数据涵义与数据类型 1. 1 数据的涵义 1. 1. 1 数据 数据是用以载荷信息的载体。它可以是记录下来的某种可以识别的物理符号,数据的具 体形式多种多样,如文本、图像、声音等都可以归入数据的范畴。虽然数据是信息的载体, 但并非就是信息,只有理解了数据的含义、对数据做出解释,才能得到数据中所包含的信息。 在计算机化的信息系统中,数据的格式往往与具体的计算机系统有关,随着载荷它的物理设 备的形式而改变。信息系统对数据进行处理(运算、排序、编码、分类、增强等)就是为了 得到数据中所包含的信息。 在地理信息系统中,由系统建立者输入、机器存储的各种专题地图和统计图表是数据; 系统软件中所包含的代码是计算机系统中的二进制数据; 用户对地理信息系统发出的各种指 令也是数据,等等。因此,地理信息系统的建立和运行,就是信息或数据按一定的方式流动 的过程。 数据的处理和解释是非常重要的环节。所谓数据处理,是指对数据进行收集、筛选、排 序、归并、转换、检索、计算以及分析、模拟和预测的操作,其目的就是把数据转换成便于 观察、分析、传输或进一步处理的形式;把数据加工成对正确管理和决策有用的数据;把数 据编辑后存储起来,以供不断使用。数据处理是为了解释,而数据解释需要人的智慧、学识 和经验。 1. 1. 2 地理数据(空间数据)的基本特征 地理数据一般具有三个基本特征:属性特征(非定位数据),表示实际现象或特征,例 如变量 、级别 、数量 特征 和名称 等等。 空间特 征( 定位数 据) :表 示现 象的空 间位置 或现在 所处的 地理 位置 。 空 间特 征又称 为几 何特 征或 定位 特征 , 一 般以 坐标数 据表 示, 例如 笛卡 尔 坐标等 。时间 特征( 时间 尺度) : 指现象 或物 体随时 间的变 化,其 变化的 周期 有超短 期的、 短期的、中期的、长期的等等(图 5-1) 。 图 5-1:空间数据的基本特性 [Jack Dangermond,1984] 1. 2 空间数据的类型 在 地理信 息系统 中,按 照其 特征, 数据可 分为三 种类 型:空 间特征 数据( 定位 数据 ) 、 时间属 性数据 (尺度 数据 )和专 题属性 数据( 非定 位数据) 。对于 绝大 部分地 理信息 系统的 应用来 说, 时间 和专 题属 性数据 结合 在一 起共 同作 为属性 特征 数据 , 而 空间 特征数 据和 属性 特征数据统称为空间数据(或地理数据) 。 1. 2. 1 空间特征数据 空间特 征数 据记 录的 是空 间实体 的位 置、 拓扑 关系 和几何 特征 , 这 是地 理信 息系统 区别 于其他 数据 库管 理系 统的 标志 。 空 间特 征指空 间物 体的位 置 、 形 状和大 小等 几何特 征 , 以 及 与相邻 物体 的拓 扑关 系。 位置和 拓扑 特征 是地 理或 空间信 息系 统所 独有 的, 空间位 置可 以由 不同的 坐标 系统 来描 述, 如经纬 度坐 标、 一些 标准 的地图 投影 坐标 或是 任意 的直角 坐标 等 。 人类对 空间 目标 的定 位一 般不是 通过 记忆 其空 间坐 标, 而是 确定 某一 目标 与其 他更熟 悉的 目 标间的 空间 位置 关系 , 而这 种关系 往往 也是 拓扑 关系 。 如一所 学校 位于 哪个 路口 或哪条 街道 。 1. 2. 2 专题特征数据 专题特 征指 的是 地理 实体 所具有 的各 种性 质, 如地 形的坡 度、 坡向 、某 地的 年降雨 量、 土地酸缄类型、人口密度、交通流量、空气污染程度等。这类特征在其他类型的信息系统中 均可存储和处理。专题属性特征通常以数字、符号、文本和图像等形式来表示。 1. 2. 3 时间特征数据 时间属性是指地理实体的时间变化或数据采集的时间等。严格地讲,空间数据总是在某 一特定时间或时段内采集得到或计算产生的。由于有些空间数据随时间变化相对较慢,因而 有时被忽略;有些时候,时间可以被看成一个专题特征。 1. 3 空间数据的表示方法 一般地,表示地理现象的空间数据可以细分为: 类型数据:例如考古地点、道路线和土壤类型的分布等; 面域数据:例如随机多边形的中心点、行政区域界线和行政单元等; 网络数据:例如道路交点、街道和街区等; 样本数据:例如气象站、航线和野外样方的分布区等; 曲面数据:例如高程点、等高线和等值区域; 文本数据:例如地名、河流名称和区域名称; 符号数据:例如点状符号、线状符号和面状符号(晕线)等(如图 5-2 所示)。 图 5-2:地理信息系统中各种数据以及其表现 2.数据的测量尺度 对特定 现象 的测 量就 是根 据一定 的标 准对 其赋 值或 打分。 为了 描述 地理 世界 , 对任何 事 物都要 鉴别 、 分类和 命名 。 这 些都 是量 测的组 成部 分。 它们 所使 用的参 考标 准或尺 度是 不 同 的。 测 量 的 尺 度 大 致 可 以 分成四 个层 次, 由粗 略至 详细依 次为 : 命 名或 类型 、 次 序 、 间 隔 以 及比例。 2. 1 命名(Nominal )量 定性而非定量,不能进行任何算术运算,如一个城市的名字。命名式的测量尺度也称为 类型测量尺度,只对特定现象进行标识,赋予一定的数值或符号而不定量描述。例如,可以 用不同数值表示不同的土地利用类型、植被类型或岩石类型,但是这些数值之间无数量关系, 对命名数据的逻辑运算只有“等于”或“不等于”两种形式,而其近似均值只能使用众数。 2. 2 次序(Ordinal )量 线性坐标上不按值的大小,而是按顺序排列的数,例如,事故发生危险程度的级别由大 到小被标为 1, 2, 3, …,级别的序号越低,其危险性越大,但危险性到底有多大并未给予 定量的表达。序数值相互之间可以比较大小,但不能进行加、减、乘、除等算术运算。 次序测量尺度是基于对现象进行排序来标识的,如可以把山峰按高度分级为极高山、高 山、中山、低山和丘陵等,将坡度分为陡、中、缓等。不同次序之间的间隔大小可以不同。 对次序数据的逻辑运算除了“等于”与“不等于”之外,还可以比较它们的大小,即“大于” 或“小于”。 2. 3 间隔(Interval )量 不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较 大小,并且它们之间的差值大小是有意义的。 间隔测量尺度与比例测量尺度相似,但是间隔尺度的测量值无真的零值。例如,温度是 间隔尺度的数据而不是比例数据,因为它的“ 0”测量值随着所使用的不同温度测量单位而 不同。不能说 150F的温度是 75F的温度的两倍,因为这个比例在使用摄氏单位时就改变了。 相反,降水量是比例数据,因为它有真的零值 * 。比例数据和间隔数据可用于加、减、乘、 除等运算,而且可以求算术平均。 2. 4 比率(Ratio )量 比例测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据,比例测量尺 度与使用的测量单位无关。 与某一固定点的比值计算,支持多种算术操作,如加、减、乘、除等。有关该类型属性 域的例子很多,如年降雨量、海拔高度、人口密度、发病率等。 比例数据或间隔数据可以比较容易地被转变成次序或命名数据。而命名数据则很难被转 化成次序、间隔数据或比例数据。由此可见,尽管命名数据或次序数据便于使用,易于理解, 但有时不够精确,不能用于较高级的算术运算。而比例数据或间隔数据比较精确,便于计算 机处理,但是在较复杂的 GIS 应用中,往往上述几种测量尺度的数据均需用到。 * 与比率量不同,间隔量中的零值往往是人为规定的,如摄氏温标中零摄氏度,时间中的零点等等。 图 5-3:各种数据测量尺度以及其制图表现 3.地理信息系统的数据质量 地理信 息系 统是 一个 基于 计算机 软件 、 硬 件和 数据 的集成 系统 , 该 系统 主要 通过空 间及 非空间 数据 的操 作, 实现 空间检 索、 编辑 及分 析功 能。在 GIS 的几 个主 要因 素中, 数据 是 一个极 为重 要的 因素 。 在 计算机 软件 、 硬 件环 境选 定之后 , GIS 中数据 质量 的优劣 , 决 定着 系统分 析质 量以 及整 个应 用的成 败。 GIS 提 供 的 空 间数据 的分 析方 法被 广泛 用于各 种领 域, 用于决策领域的数据,其质量要求应该是可知的或可预测的。 3. 1 数据质量的基本 概念 3. 1. 1 准确性( Accuracy) 即一个 记录 值 (测 量或 观察值 ) 与它 的真 实值 之间 的接近 程 度 。 这个 概念 是相 当抽象 的 , 似乎人 们已 经知 道存 在这 样的事 实 。 在实 际中, 测 量 的知识 可能 依赖 于测 量的 类型和 比例 尺。 一 般 而言, 单 个 的 观 察 或 测 量的准 确性 的估 价仅 仅是 通过与 可获 得的 最准 确的 测量或 公认 的 分类进 行比 较 。 空间 数据 的准确 性经 常是 根据 所指 的位置 、 拓 扑 或非空 间属 性来分 类的 。 它 可用误差( Error)来衡量。 3. 1. 2 精度( Precision) 即对现 象描 述的 详细 程度 。 如 对同 样的 两点 , 精 度 低的数 据并 不一 定准 确度 也低 。 精 度 要求测 量能 以最 好的 准确 性来记 录, 但是 这可 能误 导提供 了较 大的 精度 , 因 为超出 一个 测量 仪器的 已知 准确 度的 数字 在效率 上是 冗于 的。 因此, 如果手 工操 作的 数字 化板 所返回 的坐 标 不可能 依赖 于 比 0.1mm 还要准确 的一 个“ 真正 的” 数值, 那么 就不 存在 任何 的点, 在十 分 之一的地方是以 mm 表示的。 3. 1. 3 空间分辨率(Spatial Resolution) 分辨率是两个可测量数值之间最小的可辩识的差异。那么空间分辨率可以看作记录变化 的最小距离。在一张用肉眼可读的地图上,假设一条线用来记录一个边界,分辨率通常由最 小线的宽度来确定。地图上的线很少以小于 0.1mm 的宽度来画。在一个图形扫描仪中最细 的物理分辨率从理论上讲是由设施的像元之间的分离来确定的。在一个激光打印机上这是一 英寸的 300 分之一,而且在高质量的激光扫描仪上,这会细化十倍。如果没有放大,最细的 激光扫描仪的线是看不到的,尽管这依赖于背景颜色的对照。因此,在人的视觉分辨率和设 备物理分辨率之间存在着一个差异。一个相似的区别可以存在于两个最小距离之间,即当人 操作者操作数字化仪时所区别的最小距离和数字化仪硬件可以不断地报告的最小距离。 3. 1. 4 比例尺(Scale ) 比例尺是地图上一个记录的距离和它所表现的“真实世界的”距离之间的一个比例。地 图的比例尺将决定地图上一条线的宽度所表现的地面的距离。例如,在一个 1:10000 比例 尺的地图上,一条 0.5mm 宽度的线对应着 5m 的地面距离。如果这是线的最小的宽度,那 么就不可能表示小于 5m 的现象。 3. 1. 5 误差(Error) 定义出一个所记录的测量和它的事实之间的准确性以后,很明显对于大多数目的而言, 它的数值是不准确的。误差研究包括:位置误差,即点的位置的误差、线的位置的误差和多 边形的位置的误差;属性误差;位置和属性误差之间的关系。 3. 1. 6 不确定性(Uncertainty ) 地理信息系统的不确定性包括空间位置的不确定性、属性不确定性、时域不确定性、逻 辑上的不一致性及数据的不完整性。空间位置的不确定性指 GIS 中某一被描述物体与其地 面上真实物体位置上的差别;属性不确定性是指某一物体在 GIS 中被描述的属性与其真实 的属性之差别;时域不确定性是指在描述地理现象时,时间描述上的差错;逻辑上的不一致 性指数据结构内部的不一致性,尤其是指拓扑逻辑上的不一致性;数据的不完整性指对于给 定的目标,GIS 没有尽可能完全地表达该物体。 3. 2 空间数据质量问题的来源 从空间数据的形式表达到空间数据的生成,从空间数据的处理变换到空间数据的应用, 在这两个过程中都会有数据质量问题的发生。下面按照空间数据自身存在的规律性,从几个 方面来阐述空间数据质量问题的来源。 3. 2. 1 空间现象自身存在的不稳定性 空间数据质量问题首先来源于空间现象自身存在的不稳定性。 空间现象自身存在的不稳 定性包括空间特征和过程在空间、专题和时间内容上的不确定性。空间现象在空间上的不确 定性指其在空间位置分布上的不确定性变化;空间现象在时间上的不确定性表现为其在发生 时间段上的游移性;空间现象在属性上的不确定性表现为属性类型划分的多样性,非数值型 属性值表达的不精确性。因此,空间数据存在质量问题是不可避免的。 3. 2. 2 空间现象的表达 数据采集中的测量方法以及量测精度的选择等受到人类自身的认识和表达的影响, 这对 于数据的生成会出现误差。如在地图投影中,由椭球体到平面的投影转换必然产生误差;用 于获取各种原始数据的各种测量仪器都有一定的设计精度,如 GPS 提供的地理位置数据都 有用户要求的一定设计精度,因而数据误差的产生不可避免。 3. 2. 3 空间数据处理中的误差 在空间数据处理过程中,容易产生的误差有以下几种: 投影变换:地图投影是开口的三维地球椭球面到二维场平面的拓扑变换。在不同投影形 式下,地理特征的位置、面积和方向的表现会有差异。 地图数字化和扫描后的矢量化处理:数字化过程采点的位置精度、空间分辨率、属性赋 值等都可能出现误差。 数据格式转换:在矢量格式和栅格格式之间的数据格式转换中,数据所表达的空间特征 的位置具有差异性。 数据抽象:在数据发生比例尺变换时,对数据进行的聚类、归并、合并等操作时产生的 误差,如知识性误差和数据所表达的空间特征位置的变化误差。 建立拓扑关系:拓扑过程中伴随有数据所表达的空间特征的位置坐标的变化。 与主控数据层的匹配:一个数据库中,常存储同一地区的多层数据面,为保证各数据层 之间空间位置的协调性,一般建立一个主控数据层以控制其它数据层的边界和控制点。在与 主控数据层匹配的过程中也会存在空间位移,导致误差。 数据叠加操作和更新:数据在进行叠加运算以及数据更新时,会产生空间位置和属性值 的差异。 数据集成处理: 指在来源不同、 类型不同的各种数据集的相互操作过程中所产生的误差。 数据集成是包括数据预处理、数据集之间的相互运算、数据表达等过程在内的复杂过程,其 中位置误差、属性误差都会出现。 数据的可视化表达:数据在可视化表达过程中为适应视觉效果,需对数据的空间特征位 置、注记等进行调整,由此产生数据表达上的误差。 数据处理过程中误差的传递和扩散:在数据处理的各个过程中,误差是累计和扩散的, 前一过程的累计误差可能成为下一个阶段的误差起源,从而导致新的误差的产生。 3. 2. 4 空间数据使用中的误差 在空间数据使用的过程中也会导致误差的出现,主要包括两个方面:一是对数据的解释 过程,二是缺少文档。对于同一种空间数据来说,不同用户对它的内容的解释和理解可能不 同,处理这类问题的方法是随空间数据提供各种相关的文档说明,如元数据。另外,缺少对 某一地区不同来源的空间数据的说明,如缺少投影类型、数据定义等描述信息,这样往往导 致数据用户对数据的随意性使用而使误差扩散。 表 5-1:数据的主要误差来源 数据处理过程 误差来源 数据搜集 野外测量误差:仪器误差、记录误差 遥感数据误差:辐射和几何纠正误差、信息提取误差 地图数据误差:原始数据误差、坐标转换、制图综合及印刷 数据输入 数字化误差:仪器误差、操作误差 不同系统格式转换误差:栅格- 矢量转换、三角网- 等值线转换 数据存储 数值精度不够 空间精度不够:每个格网点太大、地图最小制图单元太大 数据处理 分类间隔不合理 多层数据叠合引起的误差传播:插值误差、多源数据综合分析误 差 比例尺太小引起的误差 数据输出 输出设备不精确引起的误差 输出的媒介不稳定造成的误差 数据使用 对数据所包含的信息的误解 对数据信息使用不当 3. 3 常见空间数据的误差分析 GIS 中的误差是指 GIS 中数据表示与其现实世界本身的差别。数据误差的类型可以是随 机的,也可以是系统的。归纳起来,数据的误差主要有四大类,即几何误差、属性误差、时 间误差和逻辑误差。在这几种误差中,属性误差和时间误差与普通信息系统中的误差概念是 一致的,几何误差是地理信息系统所特有的,而几何误差、属性误差和时间误差都会造成逻 辑误差,因此下面主要讨论逻辑误差和几何误差。 3. 3. 1 误差的类型 1)逻辑误差 数据的不完整性是通过上述四类误差反映出来的。事实上检查逻辑误差,有助于发现不 完整的数据和其他三类误差。对数据进行质量控制或质量保证或质量评价,一般先从数据的 逻辑性检查入手。如图 5-4 所示,其中桥或停车场等与道路是相接的,如果数据库中只有桥 或停车场,而没有与道路相连,则说明道路数据被遗漏,使数据不完整。 图 5-4:各种逻辑误差 2)几何误差 由于地 图是 以二 维平 面坐 标表达 位置 ,在 二维 平面 上的几 何误 差主 要反 映在 点和线 上 。 ( 2. 1)点误差 关于某 点的 点误 差即 为测 量位置 ( x, y)与 其 真实位 置 ( x 0 , y 0 ) 的差异 。 真 实位置 的 测量方 法比 测量 位置 的要 更加精 确 , 如 在 野 外 使 用 高精度 的 GPS方法 得到 。 点 误差可 通过 计 算坐标误差和距离的方法得到。坐标误差定义为: Δx=x- x 0 Δy=y- y 0 为了衡 量整 个数 据采 集区 域或制 图区 域内 的点 误差 , 一 般抽 样测 算 ( Δx, Δy ) 。抽 样 点 应随机 分布 于数 据采 集区 内, 并具 有代 表性 。 这 样 抽样点 越多 , 所测的 误差 分布就 越接 近于 点误差的真实分布。 ( 2. 2)线误差 线在地理信息系统数 据库 中既可表示线性现象 ,又 可以通过连成的多边 形表 示面状现 象。 第 一 类 是 线 上 的 点 在 真实世 界中 是可 以找 到的 , 如 道 路 、 河流、 行政 界 线等, 这类 的线 性特征 的误 差主 要产 生于 测量和 对数 据的 后处 理; 第二类 是现 实世 界中 找不 到的, 如按 数学 投影定 义的 经纬 线、 按高 程绘制 的等 高线 , 或 者是 气候区 划线 和土 壤类 型界 限等 , 这 类线 性 特征的 线误 差及 在确 定线 的界限 时的 误差 , 被称 为解 译误差 。 解译 误差 与属 性误 差直接 相关 , 若没有属性误差,则可以认为那些类型界线是准确的,因而解译误差为零。 另外, 线分 为直 线、 折线 、 曲 线 与 直 线 混 合 的 线 ( 图 5-5) 。 GIS 数据 库中 用两 种 方 法 表 达曲线、折线,图 5-6 对这两类误差作了对照。 图 5-5:各种线(直线、折线、曲线) 图 5-6:折线和曲线的误差 线误差 分布 可以 用 Epsilon 带模型 来描 述 , 它 由 沿 着 一条线 以及 两侧 定宽 的带 构成 ,真 实的线 以某 一概 率落 于 Epsilon 带内。 Epsilon 带是 等 宽 的 (类似 于后 面讲 述的 缓冲区 , 不 过 其意义 不同 ) ,在 此基 础上, 误 差 带 模 型 被 提 出,与 Epsilon 带模 型相 比, 它在中 间 最 窄 而 在两端 较宽 。 基 于误 差带 模型, 可以 把直 线与 折线 误差分 布的 特点 分别 看作 是 “ 骨 头 型 ” 或 者“车链型”的误差分布带模式(图 5-7) 。 图 5-7:折线误差的分布 对于曲线的误差分布或许应当考虑“串肠型模式” (图 5-8) 。 图 5-8:曲线的误差分布 3. 3. 2 地图数据的质量问题 地图数 据是 现有 地图 经过 数字化 或扫 描处 理后 生成 的数据 。 在 地图 数据 质量 问题中 , 不 仅含有地图固有的误差,还包括图纸变形、图形数字化等误差。 1)地图固有误差:是指用 于数字化的地图本身所带 有的误差,包括控制点误 差、投影 误差等 。 由 于 这些误 差间 的关系 很难 确定 , 所 以很 难对其 综合 误差 作出 准确 评价 。 如 果假 定 综合误差与各类误差间存在线性关系,即可用误差传播定律来计算综合误差。 2)材料变形产生的误差:这类误差是由于图纸的大小受湿度和温度变化的影响而产生 的。温度不变的情况下,若湿度由 0%增至 25%,则纸的尺寸可能改变 1.6%;纸的膨胀率和 收缩率并不相同,即使湿度又恢复到原来的大小,图纸也不能恢复原有的尺寸,一张 6 英寸 的图纸因湿度变化而产生的误差可能高达 0.576 英寸。在印刷过程中,纸张先随温度的升高 而变长变宽,又由于冷却而产生收缩。 3)图象数字化误差:数字化方式主要有跟踪数字化和扫描数字化两种。跟踪数字化一 般有点方式和流方式两种工作方式,前者在实际工作中使用较多,后者进行数字化所产生的 误差要比前者大得多。 不同数据录入方式对数据质量的影响 跟踪数字化: 影响其数据质量的因素主要有:数字化要素对象、数字化操作人员、数字化仪和数字化 操作。其中,数字化要素对象:地理要素图形本身的高度、密度和复杂程度对数字化结果的 质量有着显著影响,如粗线比细线更易引起误差,复杂曲线比平直线更易引起误差,密集的 要素比稀疏的要素更易引起误差等;数字化操作人员:数字化操作人员的技术与经验不同, 所引入的数字化误差也会有较大的误差,这主要表现在最佳采点点位的选择、十字丝与目标 重叠程度的判断能力等方面,另外,数字化操作人员的疲劳程度和数字化的速度也会影响数 字化的质量;数字化仪的分辨率和精度对数字化的质量有着决定性的影响;数字化操作方式 也会影响到数字化数据的质量,如曲线采点方式(流方式或点方式)和采点密度等。 扫描数字化: 扫描数字化采用高精度扫描仪将图形、图象等扫描并形成栅格数据文件,再利用扫描矢 量化软件对栅格数据文件进行处理,将它转换为矢量图形数据。矢量化过程有两种方式:即 交互式和全自动。影响扫描数字化数据质量的因素包括原图质量(如清晰度)、扫描精度、 扫描分辨率、配准精度、校正精度等。 3. 3. 3 遥感数据的质量问题 遥感数据的质量问题,一部分来自遥感仪器的观测过程,一部分来自遥感图象处理和解 译过程。遥感观测过程本身存在着精确度和准确度的限制,这一过程产生的误差主要表现为 空间分辨率、几何畸变和辐射误差,这些误差将影响遥感数据的位置和属性精度。遥感图像 处理和解译过程,主要产生空间位置和属性方面的误差。这是由图像处理中的影像或图像校 正和匹配以及遥感解译判读和分类引入的,其中包括混合像元的解译判读所带来的属性误 差。 3. 3. 4 测量数据的质量问题 测量数据主要指使用大地测量、 GPS、城市测量、摄影测量和其他一些测量方法直接量 测所得到的测量对象的空间位置信息。这部分数据质量问题,主要是空间数据的位置误差。 空间数据的位置通常以坐标表示,空间数据位置的坐标与其经纬度表示之间存在着某误差因 素,由于这种误差因素无法排除,一般也不作为误差考虑。测量方面的误差通常考虑的是系 统误差、操作误差和偶然误差。 系统误差的发生与一个确定的系统有关,它受环境因素(如温度、湿度和气压等) 、仪 器结构与性能以及操作人员技能等方面的因素综合影响而产生。系统误差不能通过重复观测 加以检查或消除,只能用数字模型模拟和估计。 操作误差是操作人员在使用设备、读书或记录观测值时,因粗心或操作不当而产生的。 应采用各种方法检查和消除操作误差。一般地,操作误差可通过简单的几何关系或代数检查 验证其一致性,或通过重复观测检查并消除操作误差。 偶然误差是一种随机性的误差,由一些不可测和不可控的因素引入。这种误差具有一定 的特征,如正负误差出现频率相同、大误差少、小误差多等。偶然误差可采用随机模型进行 估计和处理。 3. 4 空间数据质量控制 数据质量控制是个复杂的过程,要控制数据质量应从数据质量产生和扩散的所有过程和 环节入手,分别用一定的方法减少误差。空间数据质量控制常见的方法有: 3. 4. 1 传统的手工方法 质量控制的人工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视 方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较 方法。 3. 4. 2 元数据方法 数据集的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时 元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变 化。 3. 4. 3 地理相关法 用空间数据的地理特征要素自身的相关性来分析数据的质量。如从地表自然特征的空间 分布着手分析,山区河流应位于微地形的最低点,因此,叠加河流和等高线两层数据时,如 河流的位置不在等高线的外凸连线上,则说明两层数据中必有一层数据有质量问题,如不能 确定哪层数据有问题时,可以通过将它们分别与其它质量可靠的数据层叠加来进一步分析。 因此,可以建立一个有关地理特征要素相关关系的知识库,以备各空间数据层之间地理特征 要素的相关分析之用。 4.空间数据的元数据 Metadata 可以译成元数据,是描述数据的数据。在地理空间数据中,元数据是说明数据 内容、质量、状况和其他有关特征的背景信息。元数据并不是一个新的概念。实际上传统的 图书馆卡片、出版图书的版权说明、磁盘的标签等都是元数据。纸质地图的元数据主要表现 为地图类型、地图图例,包括图名、空间参照系和图廓坐标、地图内容说明、比例尺和精度、 编制出版单位和日期或更新日期、销售信息等。在这种形式下,元数据是可读的,生产者和 用户之间容易交流,用户通过它可以非常容易地确定该书或地图是否能够满足其应用的需 要。 随着计算机技术和 GIS技术发展, 特别是网络通信技术的发展,空间数据共享日益普遍。 管理和访问大型数据集的复杂性正成为数据生产者和用户面临的突出问题。数据生产者需要 有效的数据管理和维护办法;用户需要找到更快、更加全面和有效的方法,以便发现、访问、 获取和使用现势性强、精度高、易管理和易访问的地理空间数据。在这种情况下,空间数据 的内容、 质量、 状况等元数据信息变得更加重要,成为信息资源有效管理和应用的重要手段。 地理信息元数据标准和操作工具已经成为国家空间数据基础设施 * 的一个重要组成部分。 在地理信息系统应用中,元数据的主要作用可以归纳为如下几个方面: 1)帮助数据生产单位有效地管理和维护空间数据、建立数据文档,并保证即使其主要 工作人员离退时,也不会失去对数据情况的了解; 2)提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络 及数据销售等方面的信息,便于用户查询检索地理空间数据; 3)帮助用户了解数据,以便就数据是否能满足其需求做出正确的判断; 4)提供有关信息,以便用户处理和转换有用的数据。 可见,元数据是使数据充分发挥作用的重要条件之一,它可以用于许多方面,包括数据 文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均 有重要的作用。 4. 1 元数据的概念及类型 4. 1. 1 元数据的概念 元数据是关于数据的描述性数据信息,它应尽可能多地反映数据集自身的特征规律,以 便于用户对数据集的准确、高效与充分的开发与利用,不同领域的数据库,其元数据的内容 会有很大差异。通过元数据可以检索、访问数据库,可以有效利用计算机的系统资源,可以 对数据进行加工处理和二次开发等。 到目前为止,科学界关于元数据认识的共同点是:元数据的目的就是促进数据集的高效 利用,并为计算机辅助软件工程(CASE )服务。元数据的内容包括: 1)对数据集的描述;对数据集中各数据项、数据来源、数据所有者及数据序代(数据 生产历史)等的说明; 2)对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、元数 据的比例尺等; 3)对数据处理信息的说明,如量纲的转换等; 4)对数据转换方法的描述; 5)对数据库的更新、集成等的说明。 4. 1. 2 元数据的类型 元数据的分类研究的目的在于充分了解和更好地使用元数据。分类的原则不同,元数据 的分类体系和内容将会有很大的差异。 1)根据元数据的内容分类 由于不同性质、不同领域的数据所需要的元数据内容有差异,而且为不同应用目的而建 * 国家空间数据基础设施的具体描述见“地球信息科学与数字地球”一章。 设的数据库的元数据内容会有很大的差异,所以将元数据化分为三种类型: (1 . 1)科研型元数据:其主要目标是帮助用户获取各种来源的数据及其相关信息,它 不仅包括如数据源名称、作者、主体内容等传统的、图书管理式的元数据,还包含数据拓扑 关系等。这类元数据的任务是帮助科研工作者高效获取所需数据。 (1. 2)评估型元数据:主要服务于数据利用的评价,内容包括数据最初收集情况、收 集数据所用的仪器、数据获取的方法和依据、数据处理过程和算法、数据质量控制、采样方 法、数据精度、数据的可信度、数据潜在应用领域等。 (1. 3)模型元数据:用于描述数据模型的元数据与描述数据的元数据在结构上大致相 同,其内容包括模型名称、模型类型、建模过程、模型参数、边界条件、作者、引用模型描 述、建模使用软件、模型输出等。 2)根据元数据描述对象分类 (1. 1)数据层元数据:指描述数据集中每个数据的元数据,内容包括日期邮戳、位置 戳、量纲、注释、误差标识、缩略标识、存在问题标识、数据处理过程等。 (1 . 2)属性元数据:是关于属性数据的元数据,内容包括为表达数据及其含义所建的 数据字典、数据处理规则(协议),如采样说明、数据传输线路及代数编码等。 (1. 3)实体元数据:是描述整个数据集的元数据,内容包括数据集区域采样原则、数 据库的有效期、数据时间跨度等。 3)根据元数据在系统中的作用分类 (1 . 1)系统级别元数据:指用于实现文件系统特征或管理文件系统中数据的信息,如 访问数据的时间、数据的大小、在存储级别中的当前位置、如何存储数据块以保证服务控制 质量等。 (1. 2)应用层元数据:指有助于用户查找、评估、访问和管理数据等与数据用户有关 的信息,如文本文件内容的摘要信息、图形快照、描述与其它数据文件相关关系的信息。它 往往用于高层次的数据管理,用户通过它可以快速获取合适的数据。 4)根据元数据的作用分类 (4. 1)说明元数据:是为用户使用数据服务的元数据。它一般用自然语言表达,如源 数据覆盖的空间范围、源数据图的投影方式及比例尺的大小、数据集说明文件等,这类元数 据多为描述性信息,侧重于数据库的说明。 (4 . 2)控制元数据:是用于计算机操作流程控制的元数据,这类元数据由一定的关键 词和特定的句法来实现。其内容包括数据存储和检索文件、检索中与目标匹配方法、目标的 检索和显示、分析查询结果排列显示、根据用户要求修改数据库中原有的内部顺序、数据转 换方法、空间数据和属性数据的集成、根据索引项把数据绘制成图、数据模型的建设和利用 等。这类元数据主要是与数据库操作有关的方法。 空间数据元数据中所用到的概念: 空间数据 (Geospatial Data):用于确定具有自然特征或者人工建筑特征的地理实体的地 理位置、属性及其边界的信息; 类型(Type) :在元数据标准中,数据类型指该数据能接收的值的类型; 对象(Object):对地理实体的部分或整体的数字表达; 实体类型(Entity Type):对于具有相似地理特征的地理实体集合的定义和描述; 点(Point) :用于位置确定的零维地理对象; 结点(Node):拓扑连接两个或多个链或环的一维对象; 标识点(Label Point) :显示地图后图表时用于特征标识的参考点; 线(Line) :一维对象的一般术语; 线段(Line Segment) :两个点之间的直线段; 串 (String):由相互连接的一系列线段组成的没有分支线段的序列,它可与自身或与其 它线相切; 弧(Arc):由数学表达式确定的点集组成的弧状曲线; 链(Link) :两个结点之间的拓扑关联; 链环(Chain) :非相切线段或由结点区分的弧段构成的有方向无分支序列; 环(Ring) :封闭状不相切链环或弧段序列; 多边形(Ploygon) :在二维平面中由封闭弧段包围的区域; 外多边形(Universe Polygon) :数据覆盖区域内最外侧的多边形,其面积是其它所有多边 形的面积之和; 内部区域(Interior Area) :不包括其边界的区域; 格网(Grid) :组成一规则或近似规则的棋盘状镶嵌表面的格网集合,或者组成一规则或 近似规则的棋盘状镶嵌的点集合; 格网单元(Grid Cell) :表示格网最小分为要素的二维对象; 矢量(Vector):有方向线的组合; 栅格(Raster):同一格网或数字影像的一个或多个叠加层; 像元(Pixel):二维图形要素,它是数学影像最小要素; 栅格对象(Raster Object) :一个或多个影象或格网,每个影象或格网表示一个数据层, 各层之间相应的格网单元或像元一致且相互套准; 图形(Graph) :与预定义的限制规则一致的零维(如 node) 、一维 (link 或 chain)和二维(T 多边形) 有拓扑相关的对象集; 数据层(Layer):集成到一起的面域分布空间数据集,它用于表示一个主体中的实体,或 者有一公共属性或属性值的空间对象的联合; 层(Stratum) :在有序系统中数据层、级别或梯度序列; 纬度(Latitude) :在中央经线上度量,以角度单位度量离开赤道的距离; 经度(Longitude):经线面到格林尼治中央经线面的角度距离; 经圈(Meridian) :穿过地球两极的地球的大圆圈; 坐标(Ordinate) :在笛卡尔坐标系中沿平行于 X 轴和 Y 轴测量的坐标值; 投影(Projection):将地球球面坐标中的空间特征(集)转化到平面坐标体系时使用的数 学转化方法; 投影参数(Projection Parameters) :对数据集进行投影操作时用于控制投影误差、变形实 际分布的参考特征; 地图(Map) :空间现象的空间表征,通常以平面图形表示; 现象(Phenomenon) :事实、发生的事件、状态等; 分辨率(Resolution) :由涉及到或使用的测量工具或分析方法能区分开的两个独立测量或 计算的值的最小差值; 质量(Quality):数据符合一定使用要求的基本或独特的性质; 详述(Explicit):由一对数或三个数分别直接描述水平位置和三维位置的方法; 介质(Media) :用于记录、存储或传递数据的物理设备。 4. 1. 3 空间数据元数据的标准 同物理、化学等学科使用的数据结构类型相比,空间数据是一种结构比较复杂的数据类 型。它涉及到对于空间特征的描述,也涉及到对于属性特征及其它们之间关系的描述,所以 空间数据元数据标准的建立是项复杂的工作;并且由于种种原因,某些数据组织或数据用户 开发出来的空间数据元数据标准很难为地学界所广泛接受。但空间数据元数据标准的建立是 空间数据标准化的前提和保证,只有建立起规范的空间数据元数据才能有效利用空间数据。 目前,针对空间数据元数据,已经形成了一些区域性的或部门性的标准 * 。 4. 2 空间数据元数据的应用 4. 2. 1 帮助用户获取数据 通过元数据,用户可对空间数据库进行浏览、检索和研究等。一个完整的地学数据库除 应提供空间数据和属性数据外,还应提供丰富的引导信息,以及由纯数据得到的分析、综述 和索引等。通过这些信息用户可以明白一系列问题,如“这些数据是什么数据?”,“这个数 据库是否有用?”等。 4. 2. 2 空间数据质量控制 无论是统计数据还是空间数据都存在数据精确问题,影响空间数据精度的原因主要有两 个方面:一是源数据的精度;一是数据加工处理工程中精度质量的控制情况。空间数据质量 控制内容包括:(1)有准确定义的数据字典,以说明数据的组成,各部分的名称,表征的内 容等;(2 )保证数据逻辑科学地集成,如植被数据库中不同亚类的区域组合成大类区,这要 求数据按一定逻辑关系有效的组合;(3 )有足够的说明数据来源、数据的加工处理工程、数 据解译的信息。这些要求可通过元数据来实现,这类元数据的获取往往由地学和计算机领域 的工作者来完成。数据逻辑关系在数据中的表达要由地学工作者来设计,空间数据库的编码 要求一定的地学基础,数据质量的控制和提高要有数据输入、数据查错、数据处理专业背景 知识的工作人员,而数据再生产要由计算机基础较好的人员来实现。所有这方面的元数据, 按一定的组织结构集成到数据库中构成数据库的元数据信息系统来实现上述功能。 4. 2. 3 在数据集成中的应用 数据集层次的元数据记录了数据格式、空间坐标体系、数据的表达形式、数据类型等信 息;系统层次和应用层次的元数据则记录了数据使用软硬件环境、数据使用规范、数据标准 等信息。这些信息在数据集成的一系列处理中,如数据空间匹配、属性一致化处理、数据在 各平台之间的转换使用等是必要的。这些信息能够使系统有效地控制系统中的数据流。 4. 3 在地理信息系统中使用元数据的原因 在地理信息系统中使用元数据, 有利于空间数据的管理共享, 有利于实现一些特定功能, 对于地理信息系统软件的开发,可以提高开发的效率和质量。 * 空间数据元数据标准的具体介绍见“地理信息系统标准”一章。 4. 3. 1 性能上的原因 1)完整性(Completeness ) 面向对象的地理信息系统和空间数据库的目标之一,是把事物的有关数据都表示为类的 形式,而这些类也包括类自身,即复杂的“类的类”结构。这就要求有支持类与类之间相互 印证和操作的机制,而元数据可以帮助这个机制的实现。 2)可扩展性(Extensibility) 有意地延伸一种计算机语言或者数据库特征的语义是很有用的,如把跟踪或引擎信息的 生成结果添加到操作请求中,通过动态改变元数据信息可以实现这种功能。 3)特殊性(Specialization) 继承机制是靠动态连接操作请求和操作体来实现的,语言及数据库以结构化和语义信息 的相关上下文(Context )方式把操作请求传递给操作体,而这些信息可以通过元数据表达。 4)安全性(Safety) 分类完好的语言和数据库都支持动态类型检测,类的信息表示为元数据,这样在系统运 行时,可以被类检测者访问。 4. 3. 2 功能上的原因 1)查错功能(Debugging) 在查错时使用元数据信息,有助于检测可运行应用系统的解释和修改状态。 2)浏览功能(Browsing) 为数据的控制类开发浏览器时,为显示数据,要求能解释数据的结构,而这些信息是以 元数据来表达的。 3)程序生成(Program Generation) 如果允许访问元数据,则可以利用关于结构的信息自动生成程序,如数据库查询的优化 处理和远程过程调用残体(或“桩”,stub)生成。 4. 4 空间数据元数据的获取与管理 4. 4. 1 空间数据元数据的获取 空间数据元数据的获取是个较复杂的过程,相对于基础数据的形成时间,它的获取可分 为三个阶段:数据收集前、数据收集中和数据收集后。对于模型元数据,这三个阶段分别是 模型形成前、模型形成中和模型形成后。 第一阶段的元数据是根据要建设的数据库的内容而设计的元数据,内容包括:普通元数 据、专指性元数据;第二阶段的元数据随数据的形成同步产生;第三阶段的元数据是在上述 数据收集到以后,根据需要产生的,包括数据处理过程描述、数据利用情况、数据质量评估、 浏览文件的形成、拓扑关系、影像数据的指标体及指标、数据集大小、数据存放路径等。 空间数据元数据的获取方法主要有五种:键盘输入、关联表、测量法、计算法和推理法。 键盘输入一般工作量大且易出错;关联表方法是通过公共项(字段)从已存在的元数据或数 据中获取有关的;测量法容易使用且出错较少,如用全球定位系统测量数据空间点的位置等; 计算方法指由其它元数据或数据计算得到的元数据,如水平位置可由仪器设置及时间计算得 到;推理方法指根据数据的特征获取元数据。在元数据获取的不同阶段,使用的方法也有差 异。在第一阶段主要是键入方法和关联表方法;第二阶段主要采样测量方法;第三阶段主要 方法是计算和参考方法。 4. 4. 2 空间数据元数据的管理 空间数据元数据的理论和方法涉及到数据库和元数据两方面。由于元数据的内容、形式 的差异,元数据的管理与数据涉及的领域有关,它是通过建立在不同数据领域基础上的元数 据信息系统实现的。在元数据管理信息系统中,物理层存放数据与元数据,该层由一些软件 通过一定的逻辑关系与逻辑层关联起来。在概念层中用描述语言及模型定义了许多概念,如 实体名称、别名等。通过这些概念及其限制特征,经过与逻辑层关联可获取、更新物理层的 元数据及数据。 4. 5 元数据存储和功能实现 元数据系统用于数据库的管理,可以避免数据的重复存储,通过元数据建立的逻辑数据 索引可以高效查询检索分布式数据库中任何物理存储的数据。 减少数据用户查询数据库及获 取数据的时间,从而减低数据库的费用。数据库的建设和管理费用是数据库整体性能的反映, 通过元数据可以实现数据库的设计和系统资源的利用方面开支的合理分配,数据库许多功能 (如数据库检索、数据转换、数据分析等)的实现是靠系统资源的开发来实现的,因而这类 元数据的开发和利用将大大地增强数据库的功能并降低数据库的建设费用。 伴随着人类对数字地理信息重要性认识的加深,元数据标准化这一问题便逐渐成为共享 地学信息的热点,而要研究元数据体系,则首先要对元数据的理论基础有一个正确的分析。 事实上元数据标准依赖于信息共享标准的理论,它与自然科学中的许多学科都有交叉,几乎 涉及数理化天地生中的所有方面,并依赖于现代科技的发展。计算机是它的基础平台,网络 是它的通讯基础,没有数学模型和对各学科的综合认识,也就谈不上用遥感等技术研究地球 机理。因此,从宏观角度来看,地理信息标准化涉及许多领域,似乎它的理论也枚不胜举; 但从微观角度来考虑,数字地理信息所研究的共享体系理论则主要包括地理信息的模型建立 表示理论、空间参照系理论、质量体系理论以及计算机通讯技术等方面的理论,它们是数据 共享体系的基础。当然,其它能够促使地理信息共享的理论也将成为基于数字地球的元数据 体系的有力支柱。 地理信息的质量体系 (1)质量评价过程 地理空间数据的质量对数据生产者和用户来说都是一个非常重要的考虑因子,它可以使 数据生产者正确描述他们的数据集符合生产规范的程度, 也是用户决定数据集是否符合他们 应用目的的依据。因此,探索数据质量的理论问题便成为地理空间数据标准化的重要组成部 分。在元数据标准中,质量信息主要在标识信息、数据质量信息及其数据继承关系等元数据 部分中出现,其所涉及的主要元素有数据集的完备性、逻辑一致性、位置精度、时间精度、 专题精度等,而每一元素又有各自的子元素。由于用户需要不同层次的数据质量,有些用户 需要高精度的信息,而另一些用户则有较低层次的精度便可以满足他们的需求,这样对数据 集的质量标准就有不同的评价依据。但作为质量中的几何精度评价,则通过一定的计算公式 和相应的精度指标,可以获得数据集的几何精度。 (2)多尺度评价依据 在质量评定过程中,一般来说,数据的精度或准确度越高越好,但在实际应用中却不能 不分对象一概而论。事实上有的数据在应用中的意义很大(如大地控制点等),其本身精度 也可以达到很高,因此对这些数据的精度要求也就很高;而另一些数据本身的精度不可能很 高,如不同土壤类型的面积,由于它们之间的界限是模糊的,所以面积也是相对的,因此精 度要求不可能很高;有的数据的精度可以达到很高,但需要花费很多的人力、物力和时间, 而生产上或应用上又不一定要求很高。因此,在实际应用中应根据具体需要来评定数据的质 量。地球是一个复杂的系统,不少物体具有不确定性或模糊性特征。有些物体本身就没有明 确的界限,它们是逐渐过渡的,在由量变到质变过程中,难以确定其边界线;有些虽然有明 确的定义,但很难操作;有些数据是动态的,甚至是瞬间的。通过上面的分析,应该在地理 信息描述中辨证地分析精度问题,既要追求很高的数据精度,又要避免“冗余”精度,以避 免造成精度浪费。 (3)数据的实效性与唯一性 地球系统的数据,有些具有明显的时效(时间)特征,有的则对时间的反应比较迟缓, 例如土地利用图的时效性来说,随地区的差异在时间上有明显的变化;而相对来说地质图、 地形图则没有明显的时效性。 在图形的时效性上,一般来说具有动态特征的数据, 它们的时间有效性较短, 相反则长。 但从研究历史变化或发展过程来说,任何时间的数据都是有用的。所以不同时效性的数据集 将根据其作用的不同来确定其重要性,而这些因素在元数据体系中都应有所反应。 另外,地球系统的数据有可派生数据和不可派生数据之分,而在数据集描述中应避免派 生数据。如在气象和水文数据中,每天的降雨量是基本数据,或不可派生数据,而月平均降 雨等都是派生的。因此,在元数据描述中,应只限于基础数据,而不应包括可派生数据。这 样,便需要有专门的元素来描述数据集的这些特征,并需要对不同的计算公式等加以阐述。 (4)数据精度的测试与报告 对于用户和数据生产者来说,所关心的数据质量是有一定联系的。数据集生产者必须使 所生产的数据集满足制图规范,而用户则根据数据集的质量信息确定该数据集是否满足他们 的应用需求。因此数据集生产者提供的数据集信息应是用户所关心的信息。因此,在数据集 报告中应包括相应的精度测试方法及其测试结果等内容。 万事开头难。 中国俗语 第六章 空间数据获取 导读:空间数据获取是地理信息系统建设首先要进行的任务,它可以有多种实现方 式包括数据转换、遥感数据处理以及数字测量等等,其中已有地图的数字化录入, 是目前被广泛采用的手段,也是最耗费人力资源的工作。在GIS中,录入的内容包 括空间信息和非空间信息,前者是录入的主体。目前,空间信息的录入主要有两种 方式,即手扶跟踪数字化和扫描矢量化,本章具体介绍了两种方式,以及相关的算 法,如曲线近似拟合,栅格图形细化跟踪等。 在图形数据录入完毕后,需要进行各种处理,包括坐标变换、拼接等等,其中最重 要的是建立拓扑关系。在拓扑建立过程中,需要先对各种错误修改,本章描述了各 种具体的错误情形,最后则介绍了多边形自动拓扑生成算法。 1.地图数字化 1. 1 概述 无论古代、现代还是将来,地图总是重要的信息形式。在计算机图形图像技术应用于地 图制作之前,各部门一般都使用纸质地图或工程图纸,纸图在查阅、计算距离和标注地名符 号等方面都是人工操作;另外不能对一幅纸地图进行修改、缩小比例和分层读图,至于地图 局部放大只能借助于放大镜,被放大的区域很小且操作不方便。 随着技术的发展,人们对地图的要求进一步提高。由于传统纸地图效率、速度和精度很 低,因此难以适应现代和未来科技发展。而通过GIS工具,可以把纸地图经过一系列处理而 转换成可以在屏幕上显示的电子化地图,可以满足人们使用地图的新的要求。为了讨论问题 方便,将矢量电子地图定义如下: 当纸地图经过计算机图形图像系统光——电转换量化为点阵数字图像,经图像处理和曲 线矢量化,或者直接进行手扶跟踪数字化后,生成可以为地理信息系统显示、修改、标注、 漫游、计算、管理和打印的矢量地图数据文件,这种与纸地图相对应的计算机数据文件称为 矢量化电子地图。这种地图工作时需要有应用软件和硬件系统的支撑。对矢量化地图的操作 是以人机交互方式,通过GIS应用软件对硬件设备的控制来实现的。 在硬件系统及相应的地理信息系统软件支持下,矢量电子地图与纸地图相比有如下优 点: .计算距离和标注地名符号快速准确; .可对地图局部放大、全图缩小和移动显示、漫游功能很强; .分层显示地图(当对地图上各种信息分不同层归类存放后,则可以显示某些层,关闭 不显示的层); .可以以图元为单位进行信息编缉修改,人机交互画线标注符号文字,删除地图上多余 的信息; .可以通过计算机网络进行电子地图传递,提供信息共享,传递的速度快,保密性强; .如果能有效解决地图符号自动分割和识别问题,则能实现地图的智能矢量化。这里智 能化是指自动矢量化和自动标注符号,最佳路径优化选择和自动跟踪目标等。 矢量电子地图与点阵地图图像相比有如下优点: .相同信息量下前者的文件相对要小得多,图越复杂表现越明显; .前者可以以图元为单位进行信息编缉修改删除,人机交互画线标注符号文字;后者只 能以像素为基本单位(如矩形图像块)进行拷贝,移动和删除,即它的编辑功能很差; .前者可对所有图元分层显示,后者只能做到对整图某区域(矩形区)的开窗显示控制。 1. 2 地图数据类型 为地图自动制图目的所搜集的上述资料,要适应计算机处理的需要,必须同时考虑通过 这些资料,最后能获取各种不同性质的地图数据。 为此,可以定义地图数据是载荷地理信息的数字集合。它们应指被输入到某种计算机系 统中进行处理,必要时可重新生成人的视觉可以感受的地理信息。在这一层意义上,地图数 据可以分为: 1)空间数据(或图形数据) 空间数据是构成地图内容要素的几何图形,例如地图上的井、山峰、灯塔、河流、道路、 等值线、湖泊、森林界线和土壤类型界线等。为表示这些要素在二维平面上空间图形的定位 特征,常用一对平面直角坐标 (X,Y) 来表示,这种地图数据称为矢量数据;或用其通过栅 格单元的左下角坐标(行和列)来表示,称此为栅格数据。 地图要素图形大致可以分为点、线、面三种基本类型。 面——可由环绕它们的线表示;也可以由其区域内的点表示; 线——可离散化成为点的集合; 而点则能用一对平面坐标系中的坐标来确定。 在实际应用中,仅有坐标数据是不够的,必须依照不同地图要素的意义,通过特别的编 码加以区别。 2)语义数据(属性数据) 语义数据又称为非几何数据,包括定性数据和定量数据。定性数据用来描述要素的分类 或对要素进行标名。定量数据是说明要素的性质、特征或强度的,例如距离、面积、人口、 产量、收人、流速,以及温度和高程等. 对于语义数据,基本上是一个地理编码问题。以科学的分类分级系统为基础,对地理环 境中各基本实体及其联系进行编码,以便唯一地对某一系统中所有地图要素进行认别和处 理,这种功能不仅在用户环境中而且在计算机系统内也是十分重要的。 当前,要为满足各方面全部需求而建立一种通用的编码是不可能的。因此,最现实的是 研制多样性编码满足各部门的不同需要,同时兼顾符合建立数据库的规定。一般来说编码的 一些基本要求包括: (2.1)要素类别——如地名,实体类型及等级等; (2.2)要素特征(属性)——每一要素可具有与它有联系的大量的属性值,它承载关 于要素特征的信息; (2.3)作用范围的描述——例如,一个区域的土壤类型; (2.4)地理定义——在某些情况下编码可以是一个实体集合的间接参考,而集合中的 每一个实体也会被它自身的地理代码所说明,如水系、地质层的编码。 在GIS数据录入过程中,空间数据的录入更为重要,因为处理空间数据和空间信息正是 GIS的核心功能。与属性数据录入相比,空间数据录入的工作量更大,并且需要GIS软件工 具的支持(利用通用的数据库软件即可以进行属性数据录入)。 1.3 数字化仪数字化 1. 3. 1 手扶跟踪数字化 尽管手 扶跟 踪数字 化( Manual Digitising)工 作量非 常繁重 ,但 是它仍 然是 目 前最为 广 泛采用的将已有地图数字化的手段。 利用手 扶跟 踪数 字化 仪可 以输入 点地 物 、 线 地 物 以 及多边 形边 界的 坐标 。 其 具体的 输入 方式与 地理 信息 系统 软件 的实现 有关 ,另 外一些 GIS 系统也 支持 用数 字化 仪 输入非 空间 信 息,如等高线的高度,地物的编码数值等等。 手扶跟踪数字化仪的通讯和参数: 手扶跟 踪数 字化仪 是通 过 RS-232(串 口) 接口 与计 算机进 行连 接的, 为了 能 够进行 正 确的数 据发 送和 接收 , 需 要进行 通讯 参数 的设 置 , 包括波 特率 、 数 据 位 、 校 验 位 、 停 止 位 等 等 。 此 外 , 数 字 化 仪 还包括 坐 标 原 点 、 分 辨率 、 采 点 方 式 、 数 据格 式等 参数。 数字 化仪 的参 数通常 可以 利用 数字 化板 上的开 关和 菜单 确定 。 为 了保证 数据 录入 的正 确 , 必须设 置数 字化 软件的参数与数字化仪的一致。 在进行 数字 化之 前, 首先 要确定 需要 数字 化哪 些信 息,在 目前 由于 大多数 GIS 软件 对 空间数 据采 用分 层管 理, 所以要 确定 输入 哪些 图层 ,以及 每个 图层 包含 的具 体内容 。另 外 , 由于数字化过程不可 能一 次完成,在两次输入 之间 地图的位置可能相对 于数 字化板发生错 动,这 样前 后两 次录 入的 坐标就 会偏 移或 旋转 。解 决该问 题的 办法 就是 ,在 每次录 入之 前 , 先输入 至少 三个 定位 点 ( Tick Marks) , 或 称为 注册 点 ( Register Points) , 这 些 点 相对于 地图 的位置是固定的,这样两次输入的内容就可以根据定位点坐标之间的关系进行匹配。 通常 , 数字 化仪 采用 两种数 字 化 方 式 , 即点 方式 ( Point Mode) 和 流方式 ( Stream Mode) , 点方式 是当 录入 人员 按下 游标 (Puck)的 按 键 时 , 向 计 算机发 送一 个点 的坐 标。 输入点 状地 物 要素时 必须 使用 点输 入方 式; 而线 和多 边形 地物 的 录入可 以使 用点 方式 , 在 输入时 , 输 入 者 可以有选择地输入曲线上的采样点,而采样点必须能够反映曲线的特征。 流方式 录入 能够 加快 线或 多边形 地物 的录 入速 度 , 在录入 过程 中 , 当 录 入 人 员沿着 曲线 移动游 标时 , 能 够 自 动 记 录经过 点的 坐标 。 采 用 流 方式录 入曲 线时 , 往 往 采 集点的 数目 要多 于 点 方式, 造成 数据 量过大 , 一 个解 决的 方案 是对记 录 的 点 进 行 实 时 采样, 即 尽 管 系 统 接 收 到了点的坐标,但是可以根据采样原则确定是否记录该点 * 。 目前大多 数系统 采取两 种 采样原则 ,即距 离流方 式 ( Distance Stream)和时 间流方式 ( Time Stream) (图 6-1)。 (a) (b) 图 6-1:距离流方式和时间流方式 (a)距离流方式是当前接收的点与上一点距离超过一定阈值,才记录该点; * 也可以在整个曲线录入完毕后,使用下面描述曲线离散化算法去掉一些非特征点。 (b)采用时间流方式时,按照一定时间间隔对接收的点进行采样。 采用时间流方式录入时,一个优点是当录入曲线比较平滑时,录入人员往往移动游标比 较快,这样记录点的数目少;而曲线比较弯曲时,游标移动较慢,记录点的数目就多。而采 用距离流方式时,容易遗漏曲线拐点,从而使曲线形状失真。所以在保证曲线的形状方面, 时间流方式要优于距离流方式。 在实际的录入过程中,可以根据不同的录入对象选择不同的录入方式。例如,当录入地 块图时,由于其边界多为直线,并且点的数据较少,可以采用点方式录入;录入交通线时, 因为要保证某些特征点位置的准确性,也可以使用点方式;而等高线的录入由于数据量大, 使用流方式可以加快录入速度。 其它的矢量数据录入方式: 尽管手扶跟踪数字化是目前最主要的矢量格式地理数据的录入手段,但是在某些场合 下,也可以采用其它的数据输入方式: 1)其它数据转换: 其它格式数据的转换包括三种情形: (1.1)其它矢量格式数据(往往是由其它 GIS 软件制订)的转换; (2.2)坐标数据,往往表现为关系数据库表的形式(表 6-1); (2. 3)位置描述信息,以关系数据表形式存取,同样可以转换为不太精确的坐标数据 (表 6-2)。 表 6-1:测站信息表(部分) 测站编码 经度 纬度 68013344 107.2 29.8 68026785 115.5 30.2 表 6-2:企业员工信息表(部分) 姓名 住址 张三 北京市海淀区 李四 河北省石家庄市 2)键盘录入: 对于数据量较小、并且已知地物精确坐标的情况下,可以采用键盘录入。此外键盘录入 也是录入属性数据的主要手段。 3)鼠标录入: 如果不愿意手扶跟踪数字化,而扫描矢量化又难以识别地物时,可以使用鼠标录入,通 常是将地图扫描后,作为底图显示在屏幕上,用鼠标参照底图进行采点。由于鼠标定位不如 数字化仪精确,所以一般用于输入一些示意图。 4)其它定点测量设备: 目前 GPS 已经成为流行的定位导航设备, 它同样可以为 GIS 提供矢量格式的坐标数据。 其它的定点测量设备包括平板测图仪等,使用这些设备,最重要的是要考虑精度问题。 1. 3. 2 曲线离散化算法 在数字化过程中,需要对曲线进行采样简化,即在曲线上取有限个点,将其变为折线, 并且能够在一定程度上保持原有的形状。下面介绍 Douglas-Peucker 算法(图 6-2)。 1)在曲线首尾两点 A、 B 之间连接一条直线段 AB,该直线称为曲线的弦; 2)得到曲线上离该直线段距离最大的点 C,并计算其与 AB 的距离 d; 3)比较该距离与预先给定阈值 ε 的大小,如果小于 ε ,则将该直线段作为曲线的近似, 该段曲线处理完毕; 4)如果距离大于阈值,则用 C 将曲线分为两段 AC 和 BC,并分别对两段曲线进行 1-3 步的处理。 5)当所有曲线都处理完毕后,依次连接各个分割点形成的折线,即可以作为曲线的近 似。 很明显,该算法是一个递归算法。 (a) (b) (c) (d) (e) (f) A B C d 图 6-2:曲线的离散算法 1.4 扫描矢量化及常用算法 1. 4. 1 扫描矢量化以及处理流程 随着计 算机 软件 和硬 件更 加便宜 , 并 且 提 供 了 更 多 的功能 , 空 间 数 据 获 取 成 本 成 为 GIS 项目中 最主 要的 成分 。 由 于手扶 跟踪 数字 化需 要大 量的人 工操 作 , 使 得 它 成 为以数 字为 主体 的应用项目瓶颈。扫描技术的出现无疑为空间数据录入提供了有力的工具。 常见的 地图 扫描 处理 的过 程如 图 6-3所示 。 由 于 扫 描仪扫 描幅 面一 般小 于地 图幅面 , 因 此大的 纸地 图需 先分 块扫 描, 然后 进行 相邻 图对 接 ; 当 显 示 终 端 分 辨 率 及 内 存有限 时 , 拼 接 后的数 字地图还要裁剪 成若干个 归一化矩形块, 对每个矩 形块进行矢量化 ( Vectorization) 处理后 生成 便于 编辑 处理 的矢量 地图 , 最 后 把 这 些 矢 量化的 矩形 图块 合成 为一 个完整 的矢 量 电子地图,并进行修改、标注、计算和漫游等编辑处理。 纸地图 扫描转 换 拼接子 图块 裁剪地 图 矢量图 编辑 矢量图 合成 图像处 理矢 量化 图 6-3:地图信息处理流程图 在扫描 后处 理中 , 需 要进 行栅格 转矢 量的 运算 , 一 般称为 扫描 矢量 化过 程。 扫描矢 量 化 可以自 动进 行 , 但 是 扫 描 地图中 包含 多种 信息 , 系 统难以 自动 识别 分辨 ( 例 如 , 在 一 幅 地 形 图中 , 有 等高 线、 道路 、 河流等 多种 线地 物 , 尽 管 不同地 物有 不同 的线 型 、 颜色 , 但 是对 于 计算机 系统 而言 , 仍 然 难 以 对它们 进行 自动 区分 ) , 这 使得完 全自 动矢 量化 的结 果不那 么 “可 靠” ,所以在实际应用中,常常采用交互跟踪矢量化,或者称为半自动矢量化。 将栅格图像转换为矢量地图一般需要以下一系列步骤 [Musavi 1988]: 1)图像二值化( Threshold) 图像二 值化 用于 从原 始扫 描图像 计算 得到 黑白 二值 图像 ( Binary Image) , 通 常 将图像 上 的白色 区域 的栅 格点 赋值 为 0;而 黑色 区域为 1, 黑 色区域 对应 了要 矢量 化提 取的地 物, 又 称为前景。 2)平滑( Smooth) 图像平滑用于去除图像中的随机噪声,通常表现为斑点。 3)细化 细化将 一条 线细 化为 只有 一个像 素宽 , 细 化 是 矢 量 化过程 中的 重要 步骤 , 也 是矢量 化的 基础。 4)链式编码 链式编码将细化后的图像转换成为点链的集合,其中每个点链对应于一条弧段。 5)矢量线提取 将每个 点链 转化 成为 一条 矢量线 。 每 条 线 由 一 系 列 点组成 , 点 的 数 目 取 决 于 线的弯 曲程 度和要求的精度。 除了上 述五 个步 骤以 外 , 还需要 一些 处理 以方 便图 像矢量 化过 程 , 如 图 像 拼 接和剪 裁等 等,下面对这些操作以及相关算法进行描述。 1. 4. 2 图像拼接 /裁剪 1)图像拼接 以两相 邻地 图图 像的 部分 重叠区 为基 础, 把它 们合 成为一 幅整 图的 过程 叫做 图像拼 接 , 分上下 拼接 和左 右拼 接。 以左右 拼接 为例 , 取 左图 右边缘 一个 矩形 区 域 A, 取 右图左 边缘 一 个矩形 区 域 B, 如果 A和 B有一定 的重 叠区 , 可 以利 用计算 机实 现自 动的 匹配 , 其 拼 接 算 法 如下: (1.1 ) 由 A 中 右 侧 边 缘 从右至 左依 次取 若干 个 列 L1(O) ,L1 (1) ,… ,L1 (n) ,以 各列内 像素 灰度 的长 度序 列为特 征向 量, 分 别 求 出 以上各 列的 特征 向 量 V1(O ) ,V 1( ) , …, V1(n) 。 1 (2. 2) 自动拼 接 即由 B中左侧 从左 至右 依次 取若 干列 L2(n) , L2(n-1 ) ,… ,L 2( O) , 以 各 列 内 像 素灰度 的长 度序 列为 特征 向量, 分别 求出 以上 各列 的特征 向量 V2(n ) :V 2 (n-1) , …,V 2( O) 。 若 向 量序列 [V1( O) ;V 1( 1) ,… ,V 1( n) ] 和 [V2(O) , V2(1) ,… , V2(n) ] 匹配,则转向步骤 4。 (2.3 )人 工拼 接 即固 定 A, 通 过 人 机 交 互 控 制 B 以一 定步 长上 下左 右移 动,直 到 A 和 B重叠区对齐为止。 (2.4)根据步骤2匹配情况或步骤3的偏移情况对两相邻地图图像进行修正和合成。 2)图像裁剪 把一幅图像裁成两两相邻的规则图块的过程称为地图裁剪。图像裁剪非常简单,实际应 用中,可以根据不同的硬件配置确定采用和不采用图像裁剪技术。 1. 4. 3 图像细化预处理二值图像平滑 在将地图扫描或摄像输入时,由于线不光滑以及扫描、摄像系统分辨率的限制,使得一 些曲线目标带来多余的小分支(即毛刺噪声) ;此外,还有孔洞和凹陷噪声,如图 6-4 所示。 如果不在细化前去除这几种噪声,就会造成细化误差和失真,这样会最终影响地图跟踪和矢 量化。曲线目标越宽,提取骨架和去除轮廓所需的次数也越多,因此噪声影响也越大。 图6-4:扫描图像的“毛刺”和“凹陷孔洞” 为了去除毛刺噪声的影响,可以采用如图5所示的3×3模板进行处理。处理的过程是: 按点阵格式扫描图像上每一像素,只要图像相应区域与图 6-5 中的模板(包括其三次 90 0 旋 转所形成的模板)匹配,则判定为毛刺,对应于模板中心的像素数值变为O。根据需要可进 行多次这种匹配运算。 000 010 Ⅹ Ⅹ Ⅹ 图6-5:去毛刺模板,X为任意数值 为了去除孔洞及凹陷噪声,我们采用如图6-6所示的模板进行处理,只要图像对应区域 与该模板(包括其三次90 O 旋转)匹配,则区域中心点数值变为1。 X1 X 101 Ⅹ Ⅹ Ⅹ 图6-6:去孔洞凹陷模板 总之,通过以上两种平滑处理,基本上消除了毛刺和孔洞凹陷噪声的影响,为进一步进 行细化处理打下了基础。 1. 4. 4 图像细化(Thinning ) 细化算法对二值图像进行处理,得到细化后的图像。线细化是处理包含线状地物二值图 像的一 种重 要技 术, 在地 图扫描 处理 中, 由于 地图 上主要 信息 是不 同粗 细和 不同形 状的 线 , 必须首先进行线细化,以准确、有效地提取这些线信息,并进一步完成跟踪矢量化。 线细化 ,就 是不 断去 除曲 线上不 影响 连通 性的 轮廓 像素的 过程 ,对 细化 的一 般要求 是 : g108g32保证细化后曲线的连通性 g108g32细化结果是原曲线的中心线 g108g32保留细线端点 根据各 种不 同的 应用 , 目 前已经 提出 了许 多线 细化 算法 , 如 内接 圆法 、 经 典算 法、 异步 算法、 快速并行算法及并行八边算法等,不同的算法在处理速度和效果上各有其特点。 下面介绍一个常用的细化算法,其它算法基本是此算法的改进。 首先介 绍几 个相 关的 概念 和符号 。 对 于 二 值 栅 格 图 像中每 个像 素 点 p, 以 及该 像素直 接 相邻的 8个像素点(图 6-7) ,令: p 图 6-7:像素周围的 8个直接相邻像素 1) N(p)为 p的邻点的数值的和; 2) 图像 像素 联接 数 T(p), 如果旋 转着 看像 素周 围的 点, T(p)就是 p周围 8个 点从 0变 成 1的次数,它反映了像素邻点的联接的块数(图 6-8) 。 3) p W , p E , p S , p N 分别指像素左侧、右侧、下边、上边邻点的数值。 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 (a)T=0 (b)T=0 (c)T=1 (d)T=1 (e)T=2 (f)T=2 (g)T=2 (h)T=3 (i)T=4 图 6-8:像素联结数 算法步骤如下 [Zhang-Suen, 1984]: 1:对于栅格图像中的每个点 p,进行如下操作: 如果 2≤N(p)≤6 并且 T(p)=1 并且 p N p S p E =0 并且 p W p E p S =0 则标志 p 点; 2:将所有被标志的栅格点赋值为 0,如果没有被标志的点,则算法结束; 3:对于栅格图像中的每个点 p,进行如下操作: 如果 2≤N(p)≤6 并且 T(p)=1 并且 p N p S p W =0 并且 p W p E p N =0 则标志 p 点; 4:将所有被标志的栅格点赋值为 0,如果没有被标志的点,则算法结束; 5:转到第一步。 图 6-9 显示了采用该算法细化的过程和结果。 图 6-9:线状地物的细化 1. 4. 5 链码(弗里曼码) 链码是由 弗里曼 (Fre eman)提出的 用曲线 出发点 坐 标和线的 斜率来 描述二 值 线图形 的 一种方 法。 图 6-10(a ) 所示是 链码 的八 个方 向及 它们的 序号 。图 6-10(b )的细 线的 链码 为 (3,0)21100066567,其中( 3,0)为起始点坐标,之后的数值序列描述了方向。 任意一条细线都可用链码序列表示为下式: C=a 1a2...an,0≤a i≤7 如果始点 a1和终点 an重合,则说明曲线是闭合的。 3 765 0p4 12 (a) (b) 0 1 2 3 4 5 图 6-10:链码及其对细线的表示 (a):链码的 8个方向;(b)细线 1. 4. 5 矢量线生成 扫描矢 量化 的最 后一 步是 生成矢 量线 , 可 以 很 方 便 地 将链式 编码 的每 一条 链转 换成为 一 条矢量 线 。 自 然 地 , 弯 曲 的矢量 线比 直线 需要 更多 的点 , 这 还取 决于 要求 的 精 度 。 在 矢 量 线 生成过程中,可以使用 Douglas-Peucher 算法。 目前, 自动 扫描 矢量 化还 不是完 全可 靠的 , 为 了提 高其可 靠性 , 需 要在 模式 识别方 面 做 出更多的研究。 2.空间数据录入后的处理 2. 1 图形坐标变换 在地图 录入 完毕 后, 经常 需要进 行投 影变 换, 得到 经纬度 参照 系下 的地 图。 对各种 投 影 进行坐 标变 换的 原因 主要 是输入 时地 图是 一种 投影 , 而 输出 的地 图产 物是 另 外一种 投影 。 进 行投影 变换 有两 种方 式 , 一种是 利用 多项 式拟 合 , 类似于 图像 几何 纠正 ; 另 一种是 直接 应用 投影变换公式进行变换。 2. 1. 2 基本坐标变换 在投影变换过程中,有以下三种基本的操作:平移、旋转和缩放。 1)平移 平移是将 图形的 一部分 或 者整体移 动到笛 卡尔坐 标 系中另外 的位置 (图 6-11-a),其 变 换公式如下: X’=X+Tx Y’=Y+Ty 2)缩放 缩放操作可以用于输出大小不同的图形(图 6-11-b) ,其公式为: X’=XSx Y’=YSy 3)旋转 在地图 投影 变换 中 , 经 常 要应用 旋转 操作 ( 图 6-11-c) , 实 现旋 转操 作要 用到三 角 函 数 , 假定顺时针旋转角度为θ,其公式为 * : X’=Xcosθ+Ysinθ Y’=-Xsinθ+Ycosθ X 方向 Y 方向 (a)平移 * 公式同“空间参照系统和地图投影”一章的坐标旋转公式,顺时针旋转图形相当于逆时针旋转坐标系。 (b)缩放 (c)图形旋转 图 6-11:图形坐标变换 2. 1. 2 仿射变换( Affine Tranformation) 如果综合考虑图形的平移、旋转和缩放,则其坐标变换式如下: g250 g251 g249 g234 g235 g233 + g250 g251 g249 g234 g235 g233 g250 g251 g249 g234 g235 g233 ? = Y X T T Y X YX θθ θθ λ cossin sincos )','( 上式是一个正交变换,其更为一般的形式是: g250 g251 g249 g234 g235 g233 + g250 g251 g249 g234 g235 g233 g250 g251 g249 g234 g235 g233 = Y X T T Y X dc ba YX λ)','( 后者被 称为 二维 的仿 射变 换( Affine Transformation) ,仿射 变换 在不 同的 方向 可以有 不 同的压缩和扩张,可以将球变为椭球,将正方形变为平行四边形(图 6-12) 。 图 6-12:仿射变换 2. 2 图形拼接 在对底 图进 行数 字化 以后 , 由 于图 幅比 较大 或者 使 用小型 数字 化仪 时 , 难 以 将研究 区域 的底图 以整 幅的 形式 来完 成, 这是 需要 将整 个图 幅 划分成 几部 分分 别输 入 。 在所有 部分 都输 入完毕 并进 行拼 接时 ,常 常会有 边界 不一 致的 情况 ,需 要进 行边缘 匹配 处理 (图 6-13) 。边 缘匹配 处理 , 类 似 于 下 面 提及的 悬挂 节点 处理 , 可 以由计 算机 自动 完成 , 或 者辅助 以手 工半 自动完成。 除了图 幅尺 寸的 原因 ,在 GIS 实际应 用中 ,由 于经 常要输 入标 准分 幅的 地形 图,也 需 要在输 入后 进行 拼接 处理 , 这 时, 一般 需要 先进 行 投影变 换 , 通 常 的 做 法 是 从地形 图使 用的 高斯——克吕格投影转换到经纬度坐标系中,然后再进行拼接。 (a) (b) (c) 图 6-13:图幅拼接 (a)拼接前; ( b)拼接中的边缘不匹配; (c)调整后的拼接结果 2. 3 拓扑生成 在图形 数字 化— —无 论是 手扶跟 踪数 字化 还是 扫描 矢量化 —— 完成 后, 对于 大 多数地 图 需要建 立拓 扑, 以正 确判 别地物 之间 的拓 扑关 系。 在 GIS 数据管 理中 ,拓 扑 关系可 以定 义 以下内容: 1)区域 ,如果多边形数据 DIME数据模型,每个多边形可以用一组封闭的线 * 来 表示, 而不需 要记 录封 闭线 上的 所有点 , 避 免 两 次 记 录 相 邻多边 形的 公共 边界 , 这 样减少 了数 据冗 余 * 。 * 通常称为弧段 * 与 DIME数据模型相对应的是 Spaghetti多边形编码方式,该编码方式对每个多边形都依次记录其边界上的 2)邻接性 ,另一种可以用拓扑描述的属性是多边形之间的相互邻接性。 3)连通性 ,连通性是指对弧段连接的判别,连通 性的建立和表现是网络分析的基础。 2. 3. 1 图形修改 在建立 拓扑 关系 的过 程中 , 一 些 在 数 字 化 输 入 过 程 中的错 误需 要被 改正 , 否 则, 建 立 的 拓扑关系将不能正确地反映地物之间的关系。 ESRI 定义了以下判断录入图形是否正确的六个准则,可以帮助发现拓扑错误。 1)所有录入的实体都能够表现出来; 2)没有输入额外的实体; 3)所有的实体都在正确的位置上,并且其形状和大小正确; 4)所有具有连接关系的实体都已经连上; 5)所有的多边形都有且只有一个标志点以识别它们; 6)所有的实体都在边界之内 上述的 准则 ,特 别是 第五 和第六 条, 只是 针对 ESRI 的 ARC/INFO 软件而言 ,其它 的 GIS 软件由于具体实现的不同,可能会有差异。 由于地 图数 字化 , 特 别 是 手扶跟 踪数 字化 , 是 一 件 耗 时 、 烦 杂 的 人 力 劳 动 , 在数字 化过 程中的错误几乎是不可避免的,造成数字化错误的具体原因包括: 1)遗漏某些实体; 2)某些实 体重复录 入,由 于地图信 息是二维 分布的 ,并且信 息量一般 很大, 所以要 准 确记录哪些实体已经录入,哪些实体尚未录入是困难的,这就容易造成重复录入和遗漏; 3)定位的 不准确, 数字化 仪分辨率 可以造成 定位误 差,但是 人的因素 是位置 不准确 的 主要原 因 , 如 手 扶 跟 踪 数 字化过 程中 手的 抖动 , 两 次录入 之间 图纸 的移 动都 可以使 位置 不准 确; 更重 要的 , 在 手扶 跟 踪数字 化过 程中 , 难 以 实 现完全 精确 的定 位 , 例 如 在水系 的录 入中 (图 6-14) , 将支流 的终 点 恰好录 入在 干流 上基 本上 是不可 能的 (图 6-14-a) , 更常见 的是 图 ( b)和( c)所示的两种情况。 (a) 实际地物 (b) 不及 (c) 过头 图 6-14:数字化错误——不及和过头 在数字化后的地图上,错误的具体表现形式有: 1)伪节点( Pseudo Node) ,伪 节点 使一 条完 整的 线 变成两 段( 图 15) , 造 成 伪节点 的 原因常常是没有一次录入完毕一条线。 顶点,显然公共边界被记录了两次。 Spaghetti的意思是意大利细面条,用来形象的比喻这种数据结构。 伪节点 图 6-15:伪节点 2)悬挂节点 ( Dangling Node) , 如 果 一 个 节 点 只 与 一条线 相连 接, 那么 该节 点称为 悬 挂 节 点,悬挂 节点 有多 边形 不 封闭(图 6-16-a) 、不及 和 过头(图 6-14-b,图 6-14-c) ,节 点 不重合(图 6-16-b)等几种情形。 (a)多边形不封闭 (b)节点不重合 图 6-16:悬挂节点的两种情形 3) “碎屑”多边形或“条带”多边形( Sliver Polygon) 条带多边形( 图 6-17)一般由于重复录入 引起,由于前后两次录入 同一条线的位置 不 可能完 全一 致 , 造 成 了 “ 碎屑 ” 多 边形 。 另 外, 由 于用不 同比 例尺 的地 图进 行数据 更新 , 也 可能产生“碎屑”多边形。 图 6-17:碎屑多边形 4)不正规的多边形( Weird Polygon) 不正规 的多边形( 图 6-18)是由 于输入线时,点的次序倒 置或者位置不准确引起的 。 在进行拓扑生成时,同样会产生“碎屑”多边形。 (a)正常多 边形 (b)不正规 多边 形 图 6-18:不正规的多边形 上述的错误,一般会在建立拓扑的过程中发现,需要进行编辑修改。一些错误,如悬挂 节点,可以在编辑的同时,由软件自动修改,通常的实现办法是设置一个“捕获距离” ,当 节点之间、或者节点与线之间的距离小于此数值后,即自动连接;而另外的错误需要进行手 工编辑修改。 2. 3. 2 建立拓扑关系 在图形修改完毕之后,就意味着可以建立正确的拓扑关系,拓扑关系可以由计算机自动 生成,目前大多数 GIS 软件也都提供了完善的拓扑功能;但是在某些情况下,需要对计算 机创建的拓扑关系进行手工修改,典型的例子是网络连通性。 正如拓扑的定义所描述的,建立拓扑关系时只需要关注实体之间的连接、相邻关系,而 节点的位置、弧段的具体形状等非拓扑属性则不影响拓扑的建立过程。 1)多边形拓扑关系的建立 如果使用 DIME 或者类似的编码模型,多边形拓扑关系的表达需要描述以下实体之间的 关系: g108g32多边形的组成弧段; g108g32弧段左右两侧的多边形,弧段两端的节点; g108g32节点相连的弧段。 多边形拓扑的建立过程实际上就是确定上述的关系。具体的拓扑建立过程与数据结构有 关,但是其基本原理是一致的,下面简述多边形拓扑建立过程(图 6-19)。 图 6-19 中共有 4 个节点,以 A、 B、 C、 D 表示;6 条弧段,用数字表示;以及 I、II 、 III 三个多边形(图 6-19-a)。首先定义以下概念: g108g32由于弧段是有方向的,算法中将弧段 A的起始节点称为首节点N s (A),而终止节点为 尾节点N E (A); g108g32考虑到弧段的方向性,沿弧段前进方向,将其相邻的多边形分别定义为左多边形和 右多边形P L (A)和P R (A)。 在建立拓扑之前,首先将所有弧段的左右多边形 (在实现中,可以用多边形的编码表示) 都设置为空;然后对每个节点计算与其相连弧段的在连接处的角度, 并进行排序 (图 6-19-b) (注意,这个排序是循环的)。建立拓扑的算法如下: (1)得到第一条弧段 A,并设置为当前弧段; (2)判断P L (A)和P R (A)是否为空。如果都非空,转到第一步,当所有弧段处理完毕后, 算法结束; (3)如果左多边形为空,则创建一个新的多边形P ,多边形的第一条弧段为当前弧段, 并设置P L (A)=P,设置搜寻起始节点为 N s (A),搜寻当前节点为N E (A)。如果右多边形为空, 则创建一个新的多边形 P,多边形的第一条弧段为当前弧段,并设置P R (A)=P,设置搜寻起 始节点N 0 =N E (A),搜寻当前节点N C =N S (A)。 (4)判断N 0 和N C 是否相等,如果是,则多边形所有弧段都已经找到,转到第一步。 (5)检查与当前节点相连接的、已经排列好的弧段序列,将当前弧段的下一条弧段 A' 作为多边形的第二条弧段。 ( 6)如果 N C =N S (A'),设置P L (A')=P, N C =N E (A);如果 N C = N E (A'),设置P R (A')=P, N C =N S (A),转到第四步。 如图 6-19-c 所示,如果从弧段 4 开始搜寻,找到节点 C 后,根据弧段的排序,下一条 弧段是 2;然后找到节点 A,弧段 1,整个搜寻结束,建立多边形 I,其组成弧段为 4、 2、 1。 按照这种算法,生成多边形的弧段从多边形内部看,是逆时针排列的。如果节点弧段排 序为顺时针,则算法中用 P L (A)代替P R (A),用P R (A)代替P L (A),生成的多边形弧段是顺时针 排列的。 1 2 3 4 5 6 A B C D A 3 2 1 B 4 6 1 C 2 5 4 D 3 6 5 节点表,其 中 对 于 每 个节点记录 了 顺 时 针 方向排序的 相 连 的 弧 段 I II III 2 4 5 B C A (a) I (b) (c) 1 图 6-19:多边形拓扑的建立过程 多边形 拓扑 的建 立, 要 注 意多边 形带 “ 岛 ” 的情况 , 按 照 上述算 法, 对于带 “岛” 的 多 边形 , 或 者称 为环 , 其 包 含的弧 段构 成了 多个 闭合 曲线 , 并 且 “ 岛 ” 的 弧 段 排序是 顺时 针 的 (图 6-20) (实际上,从环状多边形内部看,它仍然是逆时针的) 。 图 6-20:带“岛”的多边形建立拓扑的结果。 2)网络拓扑关系的建立 在输入 道路 、 水 系、 管 网 、 通信 线路 等信 息时, 为 了进行 流量 以及 连通 性分 析, 需 要 确 定线实 体之 间的 连接 关系 。 网 络拓 扑关 系的 建立 包 括确定 节点 与连 接线 之间 的关系 , 这 个 工 作可以 由计 算机 自动 完成 , 但 是在 一些 情况 中, 如 道路交 通应 用中 , 一 些 道 路虽然 在平 面上 相交, 但是 实际 上并 不连 通, 如 立 交 桥 , 这 是 需 要 手工修 改, 将连 通的 节点 删除 ( 图 6-21) 。 图 6-21:节点的编辑,将实际不连通的线路形成的节点删除 妈妈说:“生活就像是一盒巧克力,你永远不知道下一块的味道。” Forrest Gump 第七章 空间数据管理 导读:本章首先介绍空间数据库、与一般数据库的比较,以及空间数据库的存储方 式。 然后介绍了GIS中两种重要的数据结构:栅格结构和矢量结构,以及其具体的存储 方式,然后比较了两种结构的特点,并给出了其相互转换算法。 最后介绍了空间检索中常用的技术——空间索引,介绍了一些常用的空间索引方式, 如BSP树、R树、CELL树等;以及空间数据的查询功能。 1.空间数据库 一个信息系统及其数据库的组成,决定于系统的应用目的、 数据类型和系统的工作方式。 关于地理信息系统的内容及其功能,以及地理信息系统的一个重要特点,或者说是与一般管 理信息系统的区别,是数据具有空间分布的性质。对地理信息系统来讲,不仅数据本身具有 空间属性,系统的分析和应用也无不与地理环境直接关联。系统的这一基本特征,深刻地影 响着数据的结构、数据库的设计、分析算法和软件,以及系统的输入和输出。 1. 1 地理信息系统与一般管理信息系统的比较 从数据源的角度来看,图形和图像数据是地理信息系统数据的一个主要来源,分析处理 的结果也常用图形的方式来表示。 而一般的管理信息系统, 则多以统计数据、表格数据为主。 这一点也使地理信息系统在硬件和软件上与一般的管理信息系统有所区别。 1. 1. 1 两者的区别 1)在硬件上,为了处理图形和图像数据,系统需要配置专门的输入和输出设备,如数 字化仪、绘图机、图形图像的显示设备等;许多野外实地采集和台站的观测所得到的资源信 息是模拟量形式,系统还需要配置模——数转换设备,这些设备往往超过中央处理机的价格, 体积也比较大。 2)在软件上,则要求研制专门的图形和图像数据的分析算法和处理软件,这些算法和 软件又直接和数据的结构及数据库的管理方法有关。 3)在信息处理的内容和采用目的方面,一般的管理信息系统,主要是查询检索和统计 分析,处理的结果,大多是制成某种规定格式的表格数据,而地理信息系统,除了基本的信 息检索和统计分析外,主要用于分析研究资源的合理开发利用,制定区域发展规划,地区的 综合治理方案,对环境进行动态的监视和预测预报,为国民经济建设中的决策提供科学依据, 为生产实践提供信息和指导。 由于地理信息系统是一个复杂的自然和社会的综合体,所以信息的处理必然是多因素的 综合分析。系统分析是基本的方法,例如,研究某种地理信息系统中各组成部分间的相互关 系,利用统计数据建立系统的数学模型,根据给定的目标函数,进行数学规划,寻求最优方 案,使该系统的经济效益为最佳;或者分析系统中各部分之间反馈联系,建立系统的结构模 型,采用系统动力学的方法,进行动态分析,研究系统状态的变化和预测发展趋势等。计算 机仿真是一种有效而经济的分析方法,便于分析各种因素的影响和进行方案的比较,在自然 环境和社会经济的许多应用研究中常被采用。此外,地理信息系统还有分析量算的功能,如 计算面积、长度、密度、分布特征等以及地理实体之间的关系运算。 1. 1. 2 两者共同之处 地理信息系统和一般的信息管理系统,也有许多共同之处。两者都是以计算机为核心的 信息处理系统,都具有数据量大和数据之间关系复杂的特点,也都随着数据库技术的发展在 不断的改进和完善。比较起来,商用的管理信息系统发展快,用户数量大,而且已有定型的 软件产品可供选用,这也促进了软件系统的标准化。地理信息系统,由于上述一些特点,多 是根据具体的应用要求专门设计,数据格式和组织管理方法各不相同。目前国外已有几百个 空间数据处理系统和软件包,几乎没有两个系统是一样的,尽管大家都认为标准化是很重要 的,也作了许多努力(例如建立计算机制图的标准和规范),但分析的算法和软件系统还谈 不上标准化的问题。事实上,地理信息系统正作为一种空间信息的处理系统,成为一个单独 的研究和发展领域。 1. 2 空间数据库 1. 2. 1 数据库的概念 数据库就是为一定目的服务,以特定的数据存储的相关联的数据集合,它是数据管理的 高级阶段,是从文件管理系统发展而来的。地理信息系统的数据库(简称空间数据库或地理 数据库)是某一区域内关于一定地理要素特征的数据集合。为了直观地理解数据库,可以把 数据库作如下比较: 表 7-1:数据库与图书馆比较 数据库 图书馆 数据 图书 数据模型 书卡编目 数据的物理组织 图书存放规则、书架 数据库管理系统 图书管理员 外存 书库 用户 读者 数据存取 图书阅览 1. 2. 2 空间数据库特点 空间数据库与一般数据库相比,具有以下特点: 1)数据量特别大,地理系统是一个复杂的综合体,要用数据来描述各种地理要素,尤 其是要素的空间位置,其数据量往往很大。 2)不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数 据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系。 3)数据应用广泛,例如地理研究、环境保护、土地利用与规划、资源开发、生态环境、 市政管理、道路建设等。 1. 2. 3 数据库管理系统 数据库是关于事物及其关系的信息组合,早期的数据库物体本身与其属性是分开存储 的,只能满足简单的数据恢复和使用。数据定义使用特定的数据结构定义,利用文件形式存 储,称之为文件处理系统。 文件处理系统是数据库管理最普遍的方法,但是有很多缺点:首先每个应用程序都必须 直接访问所使用的数据文件,应用程序完全依赖于数据文件的存储结构,数据文件修改时应 用程序也随之修改;另外的问题是数据文件的共享。由于若干用户或应用程序共享一个数据 文件,要修改数据文件必须征得所有用户的认可。由于缺乏集中控制也会带来一系列数据库 的安全问题。数据库的完整性是严格的,信息质量很差比没有信息更糟。 数据库管理系统( Database Management System,DBMS )是在文件处理系统的基础上 进一步发展的系统。 DBMS 在用户应用程序和数据文件之间起到了桥梁作用。DBMS 的最 大优点是提供了两者之间的数据独立性,即应用程序访问数据文件时,不必知道数据文件的 物理存储结构。当数据文件的存储结构改变时,不必改变应用程序。 1)采用标准DBMS 存储空间数据的主要问题 * 用标准的 DBMS 来存储空间数据,不如存储表格数据那样好,其主要问题包括: (1. 1)在 GIS 中,空间数据记录是变长的,因为需要存储的坐标点的数目是变化的, 而一般数据库都只允许把记录的长度设定为固定长度。不仅如此,在存储和维护空间数据拓 扑关系方面, DBMS 也存在着严重的缺陷。因而,一般要对标准的 DBMS 增加附加的软件 功能。 (1.2)DBMS 一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作。 (1.3)GIS 需要一些复杂的图形功能,一般的 DBMS 不能支持。 (1. 4)地理信息是复杂的,单个地理实体的表达需要多个文件、多条记录、或许包括 大地网、特征坐标、拓扑关系、空间特征量测值、属性数据的关键字以及非空间专题属性等, 一般的 DBMS 也难以支持。 (1.5 )具有高度内部联系的 GIS 数据记录需要更复杂的安全性维护系统,为了保证 空间数据库的完整性,保护数据文件的完整性,保护系列必须与空间数据一起存储,否则一 条记录的改变就会使其他数据文件产生错误。一般的 DBMS 都难以保证这些。 2) GIS 数据管理方法主要 4 种类型 (2. 1)对不同的应用模型开发独立的数据管理服务,这是一种基于文件管理的处理方 法。 (2.2 )在商业化的 DBMS 基础上开发附加系统。开发一个附加软件用于存储和管理 空间数据和空间分析,使用 DBMS 管理属性数据。 (2.3 )使用现有的 DBMS,通常是以 DBMS 为核心,对系统的功能进行必要扩充, 空间数据和属性数据在同一个 DBMS 管理之下。需要增加足够数量的软件和功能来提供空 间功能和图形显示功能。 (2.4)重新设计一个具有空间数据和属性数据管理和分析功能的数据库系统。 * 在“地理信息系统软件工程技术”一章中“数据管理设计”中详细描述了各种不同的数据管理方案。 1. 3 数据与文件组织 数据是现实世界中信息的载体,是信息的具体表达形式,为了表达有意义的信息内容, 数据必须按照一定的方式进行组织和存储。 1. 3. 1 数据组织的分级 数据库中的数据组织一般可以分为四级:数据项、记录、文件和数据库。 1)数据项 数据项是可以定义数据的最小单位,也叫元素、基本项、字段等,数据项与现实世界实 体的属性相对应,数据项有一定的取值范围,称为域,域以外的任何值对该数据项都是无意 义的。每个数据项都有一个名称,称为数据项目。数据项的值可以是数值的、字母的、字母 数字的、 汉字的等形式。 数据项的物理特点在于它具有确定的物理长度,可以作为整体看待。 2)记录 记录是由若干相关联的数据项组成,是处理和存储信息的基本单位,是关于一个实体的 数据总和,构成该记录的数据项表示实体的若干属性。记录有“型”和“值”的区别, “型” 是同类记录的框架,它定义记录;而“值”是记录反映实体的内容。为了唯一标识每个记录, 就必须有记录标识符,也叫关键字。记录标识符一般由记录中的第一个数据项担任,唯一标 识记录的关键字称主关键字,其它标识记录的关键字称为辅关键字。记录可以分为逻辑记录 与物理记录,逻辑记录是文件中按信息在逻辑上的独立意义来划分的数据单位;而物理记录 是单个输入输出命令进行数据存取的基本单元。物理记录和逻辑记录之间的对应关系有一个 物理记录一对应一个逻辑记录;一个物理记录含有若干个逻辑记录;若干个物理记录存放一 个逻辑记录。 3)文件 文件是一给定类型的(逻辑)记录的全部具体值的集合,文件用文件名称标识,文件根 据记录的组织方式和存取方法可以分为:顺序文件、索引文件、直接文件和倒排文件等。 4)数据库 数据库是比文件更大的数据组织,数据库是具有特定联系的数据的集合,也可以看成是 具有特定联系的多种类型的记录的集合。数据库的内部构造是文件的集合,这些文件之间存 在某种联系,不能孤立存在。 1. 3. 2 数据间的逻辑联系 数据间的逻辑联系主要是指记录与记录之间的联系。记录是表示现实世界中的实体的。 实体之间存在着一种或多种联系,这样的联系必然要反映到记录之间的联系上来。数据之间 的逻辑联系主要有三种:一对一的联系;一对多的联系;多对多的联系。 1. 3. 3 常用数据文件 图 7-1:非顺序文件 文件组 织是 数据 组织 的一 部分, 数据 组织 既指 数据 在内存 中的 组织 , 又 指数 据在外 存中 的组织 ,而 文件 组织 则主 要指数 据记 录在 外存 设备 上的组 织, 它由 操作 系 统 OS 进行 管理, 具体讲 在外 存设 备上 如何 安排数 据和 组织 数据 , 以 及实施 对数 据的 访问 方式 等问题 。 操 作系 统实现的文件组织方式,可以分为顺序文件、索引文件、直接文件和倒排文件。 1)顺序文件 顺序文 件( 图 7-2)是 最简 单的文 件组 织形 式, 对记 录按照 主关 键字 的顺 序进 行组织 。 当主关 键字 是数 字型 时, 以其数 值的 大小 为序 ; 若 主关键 字是 文字 型的 , 则 以字母 的排 列 为 序。 一 切 存 于 磁 带 上 的 记 录 , 都 只能 是顺 序的 , 而 存于磁 盘上 的记 录, 既可 以是顺 序的 , 也 可以是 随机 的 。 顺序 文件 的记录 , 逻 辑 上是按 主关 键字排 序的 , 而在物 理存 储上可 以有 不 同 的方式 , 包 括向 量方 式: 被 存储的 文件 按地 址连 续存 放, 物 理 结 构 与 逻 辑 结 构 一致; 链方 式: 文件不 按地 址连 续存 放 , 文 件的逻 辑顺 序靠 链来 实现 , 文件中 的每 个记 录中 都含 有一个 指针 , 用以指 明下 一个 记录 的存 放地址 ;块 链方 式: 把文 件分成 若干 数据 块, 块之 间用指 针连 接 , 而块内则是连续存储。 图 7-2:顺序文件 2)索引文件 索引文件除了存储记录本身(主文件)以外,还建立了若干索引表,这种带有索引表的 文件叫索引文件。索引表中列出记录关键字和记录在文件中的位置(地址)。读取记录时, 只要提供记录的关键字值,系统通过查找索引表获得记录的位置,然后取出该记录。索引表 一般都是经过排序的,既可以是有顺序的,也可以是非顺序的,可以是单级索引,也可以是 多级索引,多级索引可以提高查找速度,但占用的存储空间较大。 3)直接文件 直接文件又称随机文件,其存储是根据记录关键字的值,通过某种转换方法得到一个物 理存储位置,然后把记录存储在该位置上。查找时,通过同样的转换方法,可以直接得到所 需要的记录。 4)倒排文件 倒排文件是带有辅索引的文件,其中辅索引是按照一些辅关键字来组织索引的(注意: 索引文件是按照记录的主关键字来构造索引的,也叫主索引)。倒排文件是一种多关键字的 索引文件,其中的索引不能唯一标识记录,往往同一索引指向若干记录。因而,索引往往带 有一个指针表,指向所有该索引标识的记录。通过辅索引不能直接读取记录,而要通过主关 键字才能查到记录的位置。倒排文件的主要优点是在处理多索引检索时,可以在辅检索中先 完成查询的‘交’、‘并’等逻辑运算,得到结果后再对记录进行存取,从而提高查找速度。 1. 4 GIS 的内部数据结构——矢量结构和栅格结构 描述地理实体的数据本身的组织方法,称为内部数据结构。空间数据结构是指适合于计 算机系统存储、管理和处理的地学图形的逻辑结构,是地理实体的空间排列方式和相互关系 的抽象描述。它是对数据的一种理解和解释,不说明数据结构的数据是毫无用处的,不仅用 户无法理解,计算机程序也不能正确的处理。对同样的一组数据,按不同的数据结构去处理, 得到的可能是截然不同的内容。空间数据结构是地理信息系统沟通信息的桥梁,只有充分理 解地理信息系统所采用的特定数据结构,才能正确地使用系统。 内部数据结构基本上可分为两大类:矢量结构和栅格结构(也可以称为矢量模型和栅格 模型)(图 7-3)。两类结构都可用来描述地理实体的点、线、面三种基本类型。 空间数据编码是空间数据结构的实现,即将根据地理信息系统的目的和任务所搜集的、 经过审核了的地形图、专题地图和遥感影像等资料按特定的数据结构转换为适合于计算机存 储和处理的数据的过程。由于地理信息系统数据量极大,一般采用压缩数据的编码方式以减 少数据冗余。 在地理信息系统的空间数据结构中,栅格结构的编码方式主要有直接栅格编码、链码、 游程长度编码、块码、四叉树码等;矢量结构主要有坐标序列编码、树状索引编码和二元拓 扑编码等编码方法。 图 7-3:矢量结构和栅格结构 1. 4. 1 矢量模型 在矢量 模型 中, 现实 世界 的要素 位置 和范 围可 以采 用点、 线或 面表 达, 与 它 们 在地图 上 表示相 似, 每一 个实 体的 位置是 用它 们在 坐标 参考 系统中 的空 间位 置 ( 坐标 ) 定 义 。 地 图 空 间中的 每一 位置 都有 唯一 的坐标 值。 点、 线 和 多 边 形 用于表 达不 规则 的地 理实 体在现 实世 界 的状态 (多边 形是由 若干 直线围 成的封 闭区域 的边 界) 。一 条线可 能表 达一条 道路, 一个多 边形可 能表 达一 块林 地等 。 矢量模 型中 的空 间实 体与 要表达 的现 实世 界中 的空 间实体 具有 一 定的对应关系。 1. 4. 2 栅格模型 在栅格 模型 中,空 间被 规 则地划 分为 栅格( 通常 为 正方形) 。地 理实 体的位 置 和状态 是 用它们 占据 的栅 格的 行、 列来定 义的 。 每个栅 格的 大小代 表了 定义 的空 间分 辨率 。 由 于位 置 是由栅 格行 列号 定义 的, 所以特 定的 位置 由距 它最 近的栅 格记 录决 定。 例如 , 某 个区 域被 划 分成 10*10 个栅格, 那么 仅能记 录位 于 这 10*10 个栅格附 近的 物体 的位 置。 栅格的 值表 达了 这个位 置上 物体 的类 型或 状态 。 采 用栅 格方法 , 空 间被划 分成 大量 规则 格网 , 而 且每 个栅 格 取值可 能不 一样 。 空 间单 元是栅 格 , 每 一个栅 格对 应于一 个特 定的 空间 位置 , 如 地表 的一 个 区域,栅格的值表达了这个位置的状态。 与矢量 模型 不一 样 , 栅 格 模 型最小 单元 与它 表达 的真 实世界 空间 实体 没有 直接 的对应 关 系。 栅格 数据 模型 中的 空间 实体单 元不 是通 常概 念上 理解的 物体 , 它们 只是 彼此 分离的 栅格 。 例如 , 道 路作 为明晰 的栅 格是不 存在 的 , 栅格 的值 才表达 了路 是一 个实 体。 道路是 被具 有 道 路属性 值的 一组 栅格 表达 的, 这 条 路 不 可 能 通 过 某 一栅格 实体 被识 别出 来。 在这两 种数 据结 构中, 空间 信息 都是 使用 统一的 单位 表达 。 在 栅格 方法中 , 统 一的 单位 是栅 格 ( 栅 格 是 不 可 再分的 ,其属 性用于 表达 对应位 置物体 的性质 ) ,表 达一个 区域所 用栅格 的数 量很大 ,但其 栅格单 元的 大小 一样 。栅 格数据 文件 包含 有上 百万 个栅格 ,每 个栅 格的 位置 都被严 格定 义 。 在矢量 方法 中, 统一 的单 元是点 、 线 和多 边形 , 与 栅格方 法相 比, 在数 量上 所用的 表达 单元 较少, 但大 小可 变。 在矢 量文件 中, 元素 的个 数或 许数千 个, 但毕 竟没 有栅 格数据 那么 多 。 同一类型的矢 量单元的位 置是用连续坐 标值定义。 矢量数据提供 的坐标位置 比栅格数据 用 行 、 列号 所表 达位 置更 精确 。 这 两 种 方 法 各 有 优 缺 点 , 究竟 采用 何种 数据 结构 , 取 决 于 利 用 数据的 目的 。 有些地 理现 象用栅 格数 据表 达更 合适 ; 有 些地 理现 象则用 矢量 数据更 有利 , 以 便表达它们之间的空间关系。 2.栅格数据结构及其编码 2. 1 栅格数据结构 2. 1. 1 定义 栅格结 构是 最简 单最 直接 的空间 数据 结构 , 是指 将地 球表面 划分 为大 小均 匀紧 密相邻 的 网格阵 列 , 每 个网格 作为 一个象 元或 象素 由行 、 列 定义 , 并 包含 一个代 码表 示该象 素的 属 性 类型或 量值 , 或仅仅 包括 指向其 属性 记录 的指 针。 因此 , 栅 格结 构是以 规则 的阵列 来表 示 空 间地物 或现 象分 布的 数据 组织, 组织 中的 每个 数据 表示地 物或 现象 的非 几何 属性特 征。 如图 7-4 所示, 在 栅 格 结 构 中 , 点用一 个栅 格单 元表 示; 线状地 物沿 线走 向的 一组 相邻栅 格单 元 表示, 每个 栅格 单元 最多 只有两 个相 邻单 元在 线上 ; 面 或 区 域 用 记 有 区 域 属 性的相 邻栅 格单 元的集 合表 示, 每个 栅格 单元可 有多 于两 个的 相邻 单元同 属一 个区 域。 遥感 影像属 于典 型的 栅格结构,每个象元的数字表示影像的灰度等级。 0 000 0 000 0 000 0 000 0 000 2 000 0 000 0 000 0 000 0 000 0 000 0 000 0 000 0 000 0 000 0 000 0 000 0 600 0 000 0 000 0 066 6 000 0 000 0 006 0 000 0 000 0 006 0 006 0 000 0 060 0 000 0 000 0 744 4 444 7 777 4 777 4 444 8 778 0 840 8 778 0 880 0 800 8 878 8 888 0 000 8 888 0 000 0 888 ( a)点 ( b)线 ( c)面 图 7-4:点、线、区域的格网 2. 1. 2 特点 栅格结 构的 显著 特点 是 : 属 性明显 , 定位 隐含 , 即数 据 直接记 录属 性的 指针 或属 性本身 , 而所在 位置 则根 据行 列号 转换为 相应 的坐 标 , 也 就 是 说定位 是根 据数 据在 数据 集中的 位置 得 到的。 如图 7-4-( a)所示 ,数据 2 表示 属性 或编 码 为 2 的一 个点 ,其 位置 由 其所在 的第 3 行、 第 4 列交 叉得到 的 。 由于栅 格结 构是 按一 定的 规则排 列的 , 所表示 的实 体的位 置很 容易 隐含在 格网 文件 的存 储结 构中, 在后 面讲 述栅 格结 构编码 时可 以看 到, 每个 存储单 元的 行列 位置可 以方 便地 根据 其在 文件中 的记 录位 置得 到 , 且 行列坐 标可 以很 容易 地转 为其他 坐标 系 下的坐 标。 在格 网文 件中 每个代 码本 身明 确地 代表 了实体 的属 性或 属性 的编 码, 如 果 为 属 性 的编码 ,则 该编 码可 作为 指向实 体属 性表 的指 针。 图 7-4-( a)表示 了代 码 为 2 的点实 体, 图 7-4-( b) 表示了 一条 代 码 为 6 的线 实体 , 而 图 7-4-( c) 则表示 了三 个面 实体 或称为 区域 实体, 代码 分别 为 4、 7 和 8。由 于栅 格行列 阵列 容易为 计算 机存 储、 操作 和显示 ,因 此这 种结构 容易 实现 , 算 法简 单, 且 易 于 扩 充 、 修 改 , 也很直 观, 特别 是易 于同 遥感影 像的 结合 处理,给地理空间数据处理带来了极大的方便。 栅格结 构表 示的 地表 是不 连续的 , 是 量化 和近 似离 散的数 据。 在栅 格结 构中, 地表被 分 成相互 邻接、 规则排 列的 矩形方 块(特 殊的情 况下 也可以 是三角 形或菱 形、 六边形 等) ,每 个地块 与一 个栅 格单 元相 对应。 栅格 数据 的比 例尺 就是栅 格大 小与 地表 相应 单元大 小之 比 。 在许多 栅格 数据 处理 时, 常假设 栅格 所表 示的 量化 表面是 连续 的, 以便 使用 某些连 续函 数 。 由于栅 格结 构对 地表 的量 化, 在 计 算 面 积 、 长 度 、 距离、 形状 等空 间指 标时 , 若 栅 格 尺 寸 较 大, 则 造 成 较 大 的 误 差 , 由于在 一个 栅格 的地 表范 围内, 可能 存在 多于 一种 的地物 , 而 表示 在 相 应 的 栅 格 结 构 中 常常是 一个 代码 。也 类似 于遥感 影像 的混 合象 元问 题,如 Landsat 的 MSS 卫星 影像 单个 象元 对应 地 表 79 米 *79 米的 矩形 区域, 影像 上记 录的 光谱 数据是 每个 象 元所对 应的 地表 区域 内所 有地物 类型 的光 谱辐 射的 总和效 果。 因而, 这种 误差 不仅有 形态 上 的畸形,还可能包括属性方面的偏差。 2. 2 决定栅格单元代码的方式 在决定 栅格 代码 时尽 量保 持地表 的真 实性 , 保 证 最 大的信 息容 量 。 图 7-5 所示 的一块 矩 形地表 区域 ,内 部含 有 A、 B、 C 三种 地物 类型 , O 点为中 心点 ,将 这个 矩形 区域近 似地 表 示为栅 格结 构中 的一 个栅 格单元 时, 可根 据需 要, 采 取如下 的方 式之 一来 决定 栅格单 元的 代 码。 图 7-5:栅格单元代码的确定 2. 2. 1 中心点法 用处于 栅格 中心 处的 地物 类型或 现象 特性 决定 栅格 代码, 在 图 7-5 所示 的矩 形区域 中, 中心点 O 落在 代码为 C 的 地物范 围内 ,按 中心 点法 的规则 ,该 矩形 区域 相应 的栅格 单元 代 码为 C,中心点法常用于具有连续分布特性的地理要素,如降雨量分布、人口密度图等。 2. 2. 2 面积占优法 以占矩 形区 域面 积最 大的 地物类 型或 现象 特性 决定 栅格单 元的 代码 , 在图 7-5 所示的 例 子中, 显 见 B 类地 物所 占 面积最 大, 故相 应栅 格代 码定 为 B。面积 占优 法常用 于 分 类 较 细 , 地物类别斑块较小的情况。 2. 2. 3 重要性法 根据栅 格内 不同 地物 的重 要性, 选取 最重 要的 地物 类型决 定相 应的 栅格 单元 代码, 假设 图 7-5 中 A 类最 重要 的地物 类 型,即 A 比 B 和 C 类 更为重 要, 则栅 格单 元的 代码应 为 A。 重要性 法常 用于 具有 特殊 意义而 面积 较小 的地 理要 素,特 别是 点、 线状 地理 要素, 如城 镇 、 交通枢纽、交通线、河流水系等,在栅格中代码应尽量表示这些重要地物。 2. 2. 4 百分比法 根据矩 形区 域内 各地 理要 素所占 面积 的百 分比 数确 定栅格 单元 的代 码 , 如 可 记 面积最 大 的两类 BA,也可以根据 B 类和 A 类所占面积百分比数在代码中加入数字。 2. 3 编码方法 2. 3. 1 直接栅格编码 这是最 简单 直观 而又 非常 重要的 一种 栅格 结构 编码 方法 , 通常 称这 种编 码的 图像 文 件 为 网格文 件或 栅格 文件 , 栅 格结构 不论 采用 何种 压缩 编码方 法, 其逻 辑原 型都 是直接 编码 网格 文件。 直接 编码 就是 将栅 格数据 看作 一个 数据 矩阵 , 逐 行 ( 或 逐列) 逐个 记 录代码 , 可 以每 行都从 左到 右逐 个象 元记 录, 也 可 以 奇 数 行 地 从 左 到右而 偶数 行地 从右 向左 记录, 为了 特定 目的还可采用其他特殊的顺序(图 7-6) 。 图 7-6:一些常用的栅格排列顺序 2. 3. 2 压缩编码方法 目前有一系列栅格数据压缩编码方法,如键码、游程长度编码、块码和四叉树编码等。 其目的,就是用尽可能少的数据量记录尽可能多的信息,其类型又有信息无损编码和信息有 损编码之分。信息无损编码是指编码过程中没有任何信息损失,通过解码操作可以完全恢复 原来的信息,信息有损编码是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损 失一部分相对不太重要的信息,解码时这部分难以恢复。在地理信息系统中多采用信息无损 编码,而对原始遥感影像进行压缩编码时,有时也采取有损压缩编码方法。 1)链码(Chain Codes ) 链码又称为弗里曼链码 [Freeman]或边界链码,链码可以有效地压缩栅格数据,而且对 于估算面积、长度、转折方向的凹凸度等运算十分方便,比较适合于存储图形数据。缺点是 对边界进行合并和插入等修改编辑工作比较困难,对局部的修改将改变整体结构,效率较低, 而且由于链码以每个区域为单位存储边界,相邻区域的边界将被重复存储而产生冗余。 2)游程长度编码(Run-Length Codes ) 游程长度编码是栅格数据压缩的重要编码方法,它的基本思路是:对于一幅栅格图像, 常常有行(或列)方向上相邻的若干点具有相同的属性代码,因而可采取某种方法压缩那些 重复的记录内容。其方法有两种方案:一种编码方案是,只在各行(或列)数据的代码发生 变化时依次记录该代码以及相同的代码重复的个数,从而实现数据的压缩。例如对图 7-4( c) 所示栅格数据,可沿行方向进行如下游程长度编码: ( 0, 1),( 4, 2),( 7, 5);( 4, 5),( 7, 3);( 4, 4),( 8, 2),( 7, 2);( 0, 2),( 4, 1),( 8, 3),( 7, 2);( 0, 2),( 8, 4),( 7, 1),( 8, 1); (0, 3), (8, 5); (0, 4), (8, 4); (0, 5), (8, 3)。 只用了 44 个整数就可以表示,而在前述的直接编码中却须要 64 个整数表示,可见游程长度 编码压缩数据是十分有效又简便的。事实上,压缩比的大小是与图的复杂程度成反比的,在 变化多的部分,游程数就多,变化少的部分游程数就少,图件越简单,压缩效率就越高。另 一种游程长度编码方案就是逐个记录各行(或列)代码发生变化的位置和相应代码,如对图 7-4( c)所示栅格数据的另一种游程长度编码如下(沿列方向): ( 1, 0),( 2, 4),( 4, 0),( 1, 4),( 4, 0);( 1, 4),( 5, 8),( 6, 0);( 1, 7),( 2, 4),( 4, 8),( 7, 0);( 1, 7),( 2, 4),( 3, 8),( 8, 0);( 1, 7),( 3, 8);( 1, 7), ( 6, 8);( 1, 7),( 5, 8)。 游程长度编码在栅格压缩时,数据量没有明显增加,压缩效率较高,且易于检索,叠加 合并等操作,运算简单,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的编码 解码运算增加处理和操作时间的情况。 3)块码 块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包 括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。 对图 7-4( c)所示图像的块码编码如下: (1,1,1,0),(1,2,2,4),(1,4,1,7),(1,5,1,7), (1,6,2,7),(1,8,1,7),(2,1,1,4),(2,4,1,4), (2,5,1,4),(2,8,1,7),(3,1,1,4),(3,2,1,4), (3,3,1,4),(3,4,1,4),(3,5,2,8),(3,7,2,7), (4,1,2,0),(4,3,1,4),(4,4,1,8),(5,3,1,8), (5,4,2,8),(5,6,1,8),(5,7,1,7),(5,8,1,8), (6,1,3,0),(6,6,3,8),(7,4,1,0),(7,5,1,8), (8,4,1,0),(8,5,1,0)。 该例中 块码 用 了 120 个整 数, 比 直 接 编 码 还多, 这是 因为例 中为 描述 方便 , 栅 格划分 很 粗糙, 在实 际应 用中 , 栅 格划分 细, 数据 冗余 多的 多, 才 能 显 出 压 缩 编 码 的 效果, 而且 还可 以作一 些技 术处 理, 如行 号可以 通过 行间 标记 而省 去记录 , 行 号和 半径 等也 不必用 双字 节整 数来记录,可进一步减少数据冗余。 块码具 有可 变的 分辨 率, 即当代 码变 化小 时图 块大 ,就是 说在 区域 图斑 内部 分辨率 低 ; 反之 , 分 辨率 高以小 块记 录区域 边界 地段 , 以 此达 到压缩 的目 的 。 因此 块码 与游程 长度 编 码 相似, 随着 图形 复杂 程度 的提高 而降 低效 率, 就是 说图斑 越大 , 压 缩比 越高 ; 图 斑 越 碎 , 压 缩比越 低。 块码 在合 并、 插入、 检查 延伸 性、 计算 面积等 操作 时有 明显 的优 越性。 然而 在某 些操作时,则必须把游程长度编码和块码解码,转换为基本栅格结构进行。 4)四叉树 四叉树 又称 四元 树或 四分 树, 是 最 有 效 的 栅 格 数 据 压缩编 码方 法之 一, 绝大 部分图 形操 作和运 算都 可以 直接 在四 叉树结 构上 实现 , 因 此四 叉树编 码既 压缩 了数 据量 , 又 可 大 大 提 高 图形操 作的 效率 。四 叉树 将整个 图像 区逐 步分 解为 一系列 被单 一类 型区 域内 含的方 形区 域 , 最小的 方形 区域 为一 个栅 格象元 ,分 割的 原则 是, 将图像 区域 划分 为四 个大 小相同 的象 限 , 而每个 象限 又可 根据 一定 规则判 断是 否继 续等 分为 次一层 的四 个象 限, 其终 止判据 是, 不管 是哪一 层上 的象 限, 只要 划分到 仅代 表一 种地 物或 符合既 定要 求的 少数 几种 地物时 , 则 不再 继续划 分 , 否 则一直 划分 到单个 栅格 象元 为止 。 四 叉树通 过树 状结 构记 录这 种划分 , 并 通 过 这种四 叉树 状结 构实 现查 询、修 改、 量算 等操 作。 图 7-7( b)为 图 7-4( c) 图形的 四叉 树 分解, 各子 象限 尺度 大小 不完全 一样 ,但 都是 同代 码栅格 单元 ,其 四叉 树如 图 7-7-( c)所 示。 0 4 4 4 4 4 4 4 0 0 0 0 0 0 0 0 0 0 0 0 0 8 4 4 4 8 8 8 8 8 7 7 4 4 7 7 7 7 7 7 7 7 7 7 8 8 8 8 0 8 0 0 8 7 8 8 8 8 8 8 8 8 88 0 4 4 7 7 7 7 7 4 4 4 4 4 7 7 7 4 4 4 4 8 8 7 7 0 0 4 8 8 8 7 7 0 0 8 8 8 8 7 8 0 0 0 8 8 8 8 8 0 0 0 0 8 8 8 8 0 0 0 0 0 8 8 8 ( a)块码分割 ( b)四叉树分割 ( c) b 的四叉树编码 图 7-7:四叉树编码 其中最 上面 的那 个结 点叫 做根结 点, 它对 应整 个图 形。 总 共 有 4 层 结点, 每个 结点对 应 一个象 限, 如 2 层 4 个结 点分别 对应 于整 个图 形的 四个象 限, 排列 次序 依次 为南西 ( SW) 、 南东( SE) 、北 西( NW) 和北东 ( NE) , 不 能 再 分 的结点 称为 终止 结点 (又 称叶子 结点 ) , 可能落 在不 同的 层上 , 该 结点代 表的 子象 限具 有单 一的代 码, 所有 终止 结点 所代表 的方 形区 域覆盖 了整 个图 形。 从上 到下, 从左 到右 为叶 子结 点编号 如图 7-7(c)所 示,共 有 40 个叶 子 结点, 也就 是原 图被 划分 为 40 个大 小不 等的 方形 子区, 图 7-7(c)的最下 面 的一排 数字 表示 各子区的代码。 由上面 图形 的四 叉树 分解 可见, 四叉 树中 象限 的尺 寸是大 小不 一的 , 位 于较 高层次 的象 限较大 , 深 度小 即分 解次 数少, 而低 层次 上的 象限 较小, 深度 大即 分解 次数 多, 这 反 映 了 图 上某些 位置 单一 地物 分布 较广而 另一 些位 置上 的地 物比较 复杂 , 变 化较 大。 正 是由于 四叉 树 编码能够自动地依照图形变化而调整象限尺寸,因此它具有极高的压缩效率。 采用四 叉树 编码 时, 为了 保证四 叉树 分解 能不 断地 进行下 去, 要求 图像 必须 为 2 n × 2 n 的 栅格阵 列, n为极 限分 割数, n+1 为四 叉树 的最 大高 度或最 大层 数,图 7-4( c)为 2 3 × 2 3 的 栅格, 因此 最多 划分 三次 , 最 大 层 数 为 4, 对 于 非 标 准尺寸 的图 像需 首先 通过 增加背 景的 方 法将图像扩充为 2 n × 2 n 的图像。 为了使 计算 机既 能以 最小 的冗余 存储 图像 对应 的四 叉树 , 又能 方便 地完 成各 种图 形 图 像 操作, 专家 们已 提出 了多 种编码 方式 , 下 面介 绍美 国马里 兰大 学地 理信 息系 统中采 用的 编码 方式, 该方 法记 录了 终止 结点 ( 或 叶 子 结 点 ) 的 地 址和值 , 值 就是 子区 的代 码, 其 中 地 址 包 括两个 部分 , 共 32 位 ( 二 进制) ,最 右 边 4 位记 录该 叶子结 点的 深度 , 即 处于 四叉树 的第 几 层上, 有了 深度 可以 推知 子区的 大小 ; 地 址由 从根 结点到 该叶 子结 点的 路径 表示, 0, 1, 2, 3 分别 表示 SW、 SE、 NW、 NE,从 右边 第 5 位开始 2n 字节 记录 这些 方向 。如 图 7-7-( c) 表示的 第六 个结 点深 度 为 3,第 一层 处于 SW 象限 , 记 为 0; 第 二层处 于 NE 象限 ,记为 3, 第三层处于 NW 象限,记为 2,表示为二进制为: 0000… 000(22 位 ); 001110( 6 位) ; 0011( 4 位) 每层象 限位 置由 两位 二进 制数表 示, 共 6 位, 十进 制整数 为 227。 这样, 记录 了各个 叶 子的地 址, 再记 上相 应代 码 值 , 就记 录了 这个 图像 , 并 可在此 编码 基础 上进 行多 种图像 操作 。 事实上 , 叶 结点 的地 址可 以直接 由子 区左 下角 的行 列坐标 , 按 二进 制按 位交 错得到 。 如 对于 6 号叶 子结 点 , 在 以 图像左 下角 为原 点的 行列 坐标系 中 , 其左 下角 行、 列 坐标为 ( 3, 2) , 表示为二进制分别为 011 和 010,按位交错就是 001110,正是 6 号地块。 对于只 有点 状地 物或 只有 线状地 物的 图件 , 为 了提 高效率 , 设 计了 略有 不同 的划分 终止 条件和记录方法,称为点四叉树和线四叉树。点四叉树对子象限的划分直到每个子象限不含 有点或只含有一个点为止,叶子的值则记录是否有点和点在子象限的位置;线四叉树划分子 象限直到子象限不含线段或只含有单个线段,对线的结点则划分到单个象素,其叶子值记录 更为复杂。 四叉树编码具有可变的分辨率,并且有区域性质,压缩数据灵活,许多运算可以在编码 数据上直接实现,大大地提高了运算效率,是优秀的栅格压缩编码之一。 一般说来,对数据的压缩是以增加运算时间为代价的。在这里时间与空间是一对矛盾, 为了更有效地利用空间资源,减少数据冗余,不得不花费更多的运算时间进行编码,好的压 缩编码方法就是要在尽可能减少运算时间的基础上达到最大的数据压缩效率,并且是算法适 应性强,易于实现。链码的压缩效率较高,已经近矢量结构,对边界的运算比较方便,但不 具有区域的性质,区域运算困难;游程长度编码既可以在很大程度上压缩数据,又最大限度 地保留了原始栅格结构,编码解码十分容易;块码和四叉树码具有区域性质,又具有可变的 分辨率,有较高的压缩效率,四叉树编码可以直接进行大量图形图像运算,效率较高,是很 有前途的方法。在此基础上已经开始发展了用于三维数据的八叉树编码等。 3.矢量数据结构及其编码 3. 1 矢量数据结构 3. 1. 1 定义 地理信息系统中另一种最常见的图形数据结构为矢量结构,即通过记录坐标的方式尽可 能精确地表示点、线、多边形等地理实体,坐标空间设为连续,允许任意位置、长度和面积 的精确定义,事实上,其精度仅受数字化设备的精度和数值记录字长的限制,在一般情况下, 比栅格结构精度高得多。 对于点实体,矢量结构中只记录其在特定坐标系下的坐标和属性代码;对于线实体,在 数字化时即进行量化,就是用一系列足够短的直线首尾相接表示一条曲线,当曲线被分割成 多而短的线段后,这些小线段可以近似地看成直线段,而这条曲线也可以足够精确地由这些 小直线段序列表示,矢量结构中只记录这些小线段的端点坐标, 将曲线表示为一个坐标序列, 坐标之间认为是以直线段相连,在一定精度范围内可以逼真地表示各种形状的线状地物; “多边形”在地理信息系统中是指一个任意形状、边界完全闭合的空间区域。其边界将整个 空间划分为两个部分:包含无穷远点的部分称为外部,另一部分称为多边形内部。把这样的 闭合区域称为多边形是由于区域的边界线同前面介绍的线实体一样,可以被看作是由一系列 多而短的直线段组成,每个小线段作为这个区域的一条边,因此这种区域就可以看作是由这 些边组成的多边形了。 跟踪式数字化仪对地图数字化产生矢量结构的数字地图,适合于矢量绘图仪绘出。矢量 结构允许最复杂的数据以最小的数据冗余进行存储,相对栅格结构来说,数据精度高,所占 空间小,是高效的空间数据结构。 3. 1. 2 特点 矢量结构的特点是:定位明显、属性隐含,其定位是根据坐标直接存储的,而属性则一 般存于文件头或数据结构中某些特定的位置上,这种特点使得其图形运算的算法总体上比栅 格数据结构复杂的多,有些甚至难以实现,当然有些地方也有所便利和独到之处,在计算长 度、面积、形状和图形编辑、几何变换操作中,矢量结构有很高的效率和精度,而在叠加运 算、邻域搜索等操作时则比较困难。 3. 2 编码方法 3. 2. 1 点实体 对于点实体和线实体的矢量编码比较直接,只要能将空间信息和属性信息记录完全就可 以了。点是空间上不能再分的地理实体,可以是具体的或抽象的,如地物点、文本位置点或 线段网络的结点等,由一对 x、 y 坐标表示。图 7-8-a 表示了点的矢量编码的基本内容。 3. 2. 2 线实体 线实体主要用来表示线状地物(如公路、水系、山脊线等)符号线和多边形边界,有时 也称为“弧”、“链”、“串”等,其矢量编码一般包括以下内容,图 7-8-b 为线实体矢量编码 的基本内容。 其中唯一标识码是系统排列序号;线标识码可以标识线的类型;起始点和终止点号可直 接用坐标表示;显示信息是显示时的文本或符号等;与线相联系的非几何属性可以直接存储 于线文件中,也可单独存储,而由标识码联接查找。 图 7-8:( a)点实体的编码,( b)线实体的编码 3. 2. 3 多边形 多边形 数据 是描 述地 理信 息的最 重要 的一 类数 据。 在区域 实体 中, 具有 名称 属性和 分类 属性的 , 多 用 多 边 形 表 示 , 如行 政区、 土地类 型、 植被分 布等; 具有 标量 属 性的, 有 时 也 用 等值线描述(如地形、降雨量等) 。 多边形 矢量 编码 不但 要表 示位置 和属 性, 更为 重要 的是要 能表 达区 域的 拓扑 性质, 如形 状、 邻域 和层 次等 , 以 便 使这些 基本 的空 间单 元可 以作为 专题 图资 料进 行显 示和操 作 , 由 于 要表达 的信 息十 分丰 富, 基于多 边形 的运 算多 而复 杂, 因 此 多 边 形 矢 量 编 码 比点和 线实 体的 矢量编码要复杂得多,也更为重要。 多边形 矢量 编码 除有 存储 效率的 要求 外 , 一 般 还 要 求 所表示 的各 多边 形有 各自 独立的 形 状, 可以 计算 各自的 周长 和面积 等几 何指 标; 各多 边形拓 扑关 系的 记录 方式 要一致 , 以 便 进 行空间 分析 ; 要 明 确 表 示 区域的 层次 , 如 岛 -湖 -岛的 关系等 。 因 此 , 它与 机助 制图系 统仅 为 显示和制图目的而设计的编码有很大不同。 1)坐标序列法( Spaghetti 方式) 图 7-9:坐标序列法表示的多边形 由多边 形边 界的 x、 y 坐标对集合 及说 明信 息组 成, 是最简 单的 一种 多边 形矢 量编码 , 如图 7-9 记为以下坐标文件: 1 0 : x 1 ,y 1 ; x 2 ,y 2 ; x 3 ,y 3 ; x 4 ,y 4 ; x 5 ,y 5 ; x 6 ,y 6 ; x 7 ,y 7 ; x 8 ,y 8 ; x 9 ,y 9 ; x 10 ,y 10 ; x 11 ,y 11 ; 2 0 : x 1 ,y 1 ; x 12 ,y 12 ; x 13 ,y 13 ; x 14 ,y 14 ; x 15 ,y 15 ; x 16 ,y 16 ; x 17 ,y 17 ; x 18 ,y 18 ; x 19 ,y 19 ; x 20 ,y 20 ; x 21 ,y 21 ; x 22 ,y 22 ; x 23 ,y 23 ; x 8 ,y 8 ; x 9 ,y 9 ; x 10 ,y 10 ; x 11 ,y 11 ; 3 0 : x 33 ,y 33 ; x 34 ,y 34 ; x 35 ,y 35 ; x 36 ,y 36 ; x 37 ,y 37 ; x 38 ,y 38 ; x 39 ,y 39 ; x 40 ,y 40 ; 4 0 : x 19 ,y 19 ; x 20 ,y 20 ; x 21 ,y 21 ; x 28 ,y 28 ; x 29 ,y 29 ; x 30 ,y 30 ; x 31 ,y 31 ; x 32 ,y 32 ; 5 0 : x 21 ,y 21 ; x 22 ,y 22 ; x 23 ,y 23 ; x 8 ,y 8 ; x 7 ,y 7 ; x 6 ,y 6 ; x 24 ,y 24 ; x 25 ,y 25 ; x 26 ,y 26 ; x 27 ,y 27 ; x 28 ,y 28 ; 坐标序 列法 文件 结构 简单, 易于实 现以 多边 形为 单位 的运算 和显 示。 这种 方法 的缺 点 是 : ( 1. 1)多边形之间的公共边界被数字化和存储两次,由此产生冗余和碎屑多边形; ( 1. 2) 每 个多 边形 自成 体系而 缺少 邻域 信息 , 难 以进行 邻域 处理 , 如 消 除 某两个 多边 形之间的共同边界; ( 1. 3)岛只作为一个单个的图形建造,没有与外包多边形的联系; ( 1. 4)不易检查拓扑错误。这种方法可用于简单的粗精度制图系统中。 2)树状索引编码法 该法采 用树 状索 引以 减少 数据冗 余并 间接 增加 邻域 信息 , 方法 是对 所有 边界 点进 行 数 字 化,将 坐标 对以 顺序 方式 存储, 由点 索引 与边 界线 号相联 系, 以线 索引 与各 多边形 相联 系 , 形成树状索引结构。 图 7-10 和图 7-11 分别 为图 7-9 的多 边形 文件 和线 文件树 状索 引示 意图 。其 文件结 构如 下: 图 7-10:线与多边形之间的树状索引 图 7-11:点与边界线之间的树状索引 采用上述的树状结构,图 7-9 的多边形数据记录如下: 1)点文件: 点号 坐标 1 x 1 ,y 1 2 x 2 ,y 2 … … 40 x 40 ,y 40 2)线文件 线号 起点 终点 点号 I 1 6 1,2,3,4,5,6 II 6 8 6,7,8 … … … … X 33 33 33,34,35,36,37,38,39,40,33 3)多边形文件 多边形编号 多边形边界 1 0 I,II,IX 2 0 III,VII,VIII,IX,X 3 0 X 4 0 IV,VI,VII 5 0 II,III,IV,V 树状索 引编 码消 除了 相邻 多边形 边界 的数 据冗 余和 不一致 的问 题 , 在简 化过 于复 杂 的 边 界线或 合并 相邻 多边 形时 可不必 改造 索引 表 , 邻 域 信 息和岛 状信 息可 以通 过对 多边形 文件 的 线索引 处理 得到 , 但 是比 较繁琐 , 因 而给 相邻 函数 运算, 消除 无用 边, 处理 岛状信 息以 及检 查拓扑 关系 带来 一定 的困 难, 而且 两个 编码 表都 需要 以人工 方式 建立 , 工作 量大 且容易 出错 。 3)拓扑结构编码法 要彻底 解决 邻域 和岛 状信 息处理 问题 必须 建立 一个 完整的 拓扑 关系 结构 , 这种 结构应 包 括以下 内容: 唯一 标识, 多边形 标识, 外包 多边 形 指针, 邻 接 多 边 形 指针, 边界链 接, 范 围 (最大 和最 小 x、 y 坐标值 ) 。 采 用拓 扑结 构编 码可 以 较好地 解决 空间 关系 查询 等问题 , 但 增 加了算法的复杂性和数据库的大小。 矢量编 码最 重要 的是 信息 的完整 性和 运算 的灵 活性 , 这是由 矢量 结构 自身 的特 点所决 定 的, 目 前 并 无 统 一 的 最 佳 的矢量 结构 编码 方法 , 在 具体工 作中 应根 据数 据的 特点和 任务 的要 求而灵活设计。 DIME(双重独立坐标地图编码, Dual Independent Map Encoding)编码系统 DIME 是 美 国 人 口 调查局 在人口 调查 的基 础上 发展 起来的 , 它通 过有 向编 码 建立了 多边 形、边界、节点之间的拓扑关系, DIME 编码成为其它拓扑编码结构的基础。 4.矢栅结构的比较及转换算法 4. 1 栅格结构与矢量结构的比较 栅格结构与矢量结构似乎是两种截然不同的空间数据结构,栅格结构“属性明显、位置 隐含”,而矢量结构“位置明显、属性隐含”,栅格数据操作总的来说比较容易实现,尤其是 作为斑块图件的表示更易于为人们接受;而矢量数据操作则比较复杂,许多分析操作(如两 张地图的覆盖操作,点或线状地物的邻域搜索等)用矢量结构实现十分困难,矢量结构表达 线状地物是比较直观的,而面状地物则是通过对边界的描述而表达。无论哪种结构,数据精 度和数据量都是一对矛盾,要提高精度,栅格结构需要更多的栅格单元,而矢量结构则需记 录更多的线段结点。一般来说,栅格结构只是矢量结构在某种程度上的一种近似,如果要使 栅格结构描述的图件取得与矢量结构同样的精度,甚至仅仅在量值上接近,则数据也要比后 者大得多。 栅格结构在某些操作上比矢量结构更有效更易于实现,如按空间坐标位置的搜索,对于 栅格结构是极为方便的,而对矢量结构则搜索时间要长得多;在给定区域内的统计指标运算, 包括计算多边形形状、面积、线密度、点密度,栅格结构可以很快算得结果,而采用矢量结 构则由于所在区域边界限制条件难以提取而降低效率,对于给定范围的开窗、缩放栅格结构 也比矢量结构优越;另一方面,矢量结构用于拓扑关系的搜索则更为高效,即诸如计算多边 形形状搜索邻域、层次信息等;对于网络信息只有矢量结构才能完全描述;矢量结构在计算 精度与数据量方面的优势也是矢量结构比栅格结构受到欢迎的原因之一,对图 7-10 而言, 假设坐标精度要求为万分之一,即 5 位数字,采用矢量结构需记录 40 个结点,每个结点用 两个双字节整数记录 x、 y坐标,加上对其他说明信息的描述, 200 个字节足够了,而若用基 本栅格记录,则需 10000*10000=10 8 个字节,即使采用单字节记录栅格代码(不超过 255), 也需约五百万个字节,当然实际图形的矢量结构记录采点一般要比图 7-10 密得多,但数据 量仍大大少于栅格结构的数据量。 栅格结构除了可使大量的空间分析模型得以容易实现之外,还具有以下两个特点:( 1) 易于与遥感相结合。遥感影像是以象元为单位的栅格结构,可以直接将原始数据或经过处理 的影像数据纳入栅格结构的地理信息系统。( 2)易于信息共享。目前还没有一种公认的矢量 结构地图数据记录格式,而不经压缩编码的栅格格式即整数型数据库阵列则易于为大多数程 序设计人员和用户理解和使用,因此以栅格数据为基础进行信息共享的数据交流较为实用。 许多实践证明,栅格结构和矢量结构在表示空间数据上可以是同样有效的,对于一个 GIS 软件,较为理想的方案是采用两种数据结构,即栅格结构与矢量结构并存,对于提高地 理信息系统的空间分辨率、数据压缩率和增强系统分析、输入输出的灵活性十分重要。两种 格式的比较见表 7-2。 表 7-2:矢量格式与栅格格式的比较 优点 缺点 矢量数据 1.数据结构紧凑、冗余度低 2.有利于网络和检索分析 3.图形显示质量好、精度高 1.数据结构复杂 2.多边形叠加分析比较困难 栅格数据 1.数据结构简单 2.便于空间分析和地表模拟 3.现势性较强 1.数据量大 2.投影转换比较复杂 4. 2 相互转换算法 矢量结 构与 网格 结构 的相 互转换 , 是 地理 信息 系统 的基本 功能 之一 , 目 前已 经发展 了许 多高效 的转 换算 法; 但是 , 从 栅 格 数 据 到 矢 量 数 据 的转换 , 特 别是 扫描 图像 的自动 识别 , 仍 然是目前研究的重点。 对于点 状实 体, 每个 实体 仅由一 个坐 标对 表示 , 其 矢量结 构和 栅格 结构 的相 互转换 基本 上只是 坐标 精度 变换 问题 , 不存在 太大 的技 术问 题 。 线 实体的 矢量 结构 由一 系列 坐标对 表示 , 在变为 栅格 结构 时, 除把 序列中 坐标 对变 为栅 格行 列坐标 外 , 还 需根据 栅格 精度要 求 , 在 坐 标点之 间插 满一 系列 栅格 点, 这 也 容 易 由 两 点 式 直 线方程 得到 。 线 实体 由栅 格结构 变为 矢量 结构与 将多 边形 边界 表示 为矢量 结构 相似 , 因 此以 下重点 讨论 多边 形 ( 面实 体) 的矢 量结 构 与栅格结构相互转换。 4. 2. 1 矢量格式向栅格格式的转换 矢量格 式向 栅格 格式 转换 又称为 多边 形填 充 , 就 是 在 矢量表 示的 多边 形边 界内 部的所 有 栅格点 上赋 以相 应的 多边 形编码 , 从 而 形 成 类 似 图 7-4 的栅格数 据阵 列。 几种 主要的 算法 描 述如下: 1)内部点扩散算法 该算法 由每 个多 边形 一个 内部点 ( 种 子 点 ) 开 始 , 向 其八个 方向 的邻 点扩 散 , 判断各 个 新加入 点是 否在 多边 形边 界上 , 如 果是 边界上 , 则 该新加 入点 不作 为种 子点 , 否 则把 非边 界 点的邻 点作 为新 的种 子点 与原有 种子 点一 起进 行新 的扩散 运算 , 并将 该种 子点 赋以该 多边 形 的编号 。 重 复上 述过 程直 到所有 种子 点填 满该 多边 形并遇 到边 界停 止为 止。 扩散算 法程 序设 计比较 复杂 , 并 且在 一定 的栅格 精度 上, 如果 复杂 图形的 同一 多边 形的 两条 边界落 在同 一个 或相邻 的两 个栅 格内 ,会 造成多 边形 不连 通, 这样 一个种 子点 不能 完成 整个 多边形 的填 充 。 2)复数积分算法 对全部 栅格 阵列 逐个 栅格 单元地 判断 该栅 格归 属的 多边形 编码 , 判别 方法 是由 待判点 对 每个多 边形 的封 闭边 界计 算复数 积分 , 对 某 个 多 边 形 , 如 果 积 分 值 为 2πr, 则 该待判 点属 于 此多边形,赋以多边形编号,否则在此多边形外部,不属于该多边形。 3)射线算法和扫描算法 射线算 法可 逐点 判断 数据 栅格点 在某 多边 形之 外或 在多边 形内 , 由待 判点 向图 外某点 引 射线 , 判 断该 射线与 某多 边形所 有边 界相 交的 总次 数, 如相 交偶 数次 , 则 待 判点在 该多 边形 外部 ,如 为奇 数次 , 则 待 判点在 该多 边形 内部 ( 图 7-12) 。采 用射 线算 法 , 要 注意的 是 : 射 线与多边形边界相交时,有一些特殊情况会影响交点的个数,必须予以排除(图 7-13) 。 扫描算 法是 射线 算法 的改 进, 将 射 线 改 为 沿 栅 格 阵 列列或 行方 向扫 描线 , 判 断与射 线算 法相似。扫描算法省去了计算射线与多边形边界交点的大量运算,大大提高了效率。 图 7-12:射线算法 图 7-13:射线算法的特殊情况 4)边界代数算法( BAF-Boundary Algebra Filling) [任伏虎 ] 边界代 数多 边形 填充 算法 是一种 基于 积分 思想 的矢 量格式 向栅 格格 式转 换算 法, 它适 合 于记录 拓扑 关系 的多 边形 矢量数 据转 换为 栅格 结构 。图 7-15 表示转 换单 个多 边形的 情况 , 多边形 编号 为 a, 模 仿积 分 求多边 形区 域面 积的 过程 , 初 始化 的栅 格阵 列各 栅 格值为 零 , 以 栅格行列为参 考坐标轴, 由多边形边界 上某点开始 顺时针搜索边 界线,当边 界上行时( 图 7-15-a) , 位于 该边 界左 侧 的具有 相同 行坐 标的 所有 栅格被 减 去 a; 当边 界下 行 时 (图 7-15-b) , 该 边 界 左 边 (前 进方 向看为 右 侧 ) 所 有栅 格点 加一个 值 a, 边 界搜 索完 毕则 完 成了多 边形 的 转换。 图 7-15:单个多边形的转换 图 7-16:多个多边形的转换 事实上 , 每 幅数 字地 图都 是由多 个多 边形 区域 组成 的, 如 果 把 不 属 于 任 何 多 边形的 区域 (包含 无穷 远点 的区 域) 看成编 号为 零的 特殊 的多 边形区 域, 则图 上每 一条 边界弧 段都 与两 个不同 编号 的多 边形 相邻 , 按 弧 段 的 前 进 方 向 分 别 称为左 、 右 多边 形, 可以 证明, 对于 这种 多个多 边形 的矢 量向 栅格 转换问 题 , 只 需 对 所 有 多 边 形边界 弧段 作如 下运 算而 不考虑 排列 次 序: 当边 界弧 段上行 时 , 该弧段 与左 图框 之间 栅格 增加一 个值 ( 左多边 形编 号减去 右多 边形 编号) ; 当边界 弧段 下行时 ,该弧 段与左 图框之 间栅 格增加 一个值 (右多 边形 编号减 去左多 边形编号) 。两个多边形转换过程如图 7-16 所示。 边界代 数法 与前 述其 他算 法的不 同之 处, 在于 它不 是逐点 判断 与边 界的 关系 完成转 换 , 而是根 据边 界的 拓扑 信息 ,通过 简单 的加 减代 数运 算将边 界位 置信 息动 态地 赋给各 栅格 点 , 实现了 矢量 格式 到栅 格格 式的高 速转 换, 而不 需要 考虑边 界与 搜索 轨迹 之间 的关系 , 因 此算 法简单、可靠性好,各边界弧段只被搜索一次,避免了重复计算。 但是这 并不 意味 着边 界代 数法可 以完 全替 代其 它算 法, 在 某 些 场 合 下 , 还 是要 采用种 子 填充算 法和 射线 算法 , 前 者应用 于在 栅格 图像 上提 取特定 的区 域; 后者 则可 以进行 点和 多边 形关系的判断。 4. 2. 2 栅格格式向矢量格式的转换 多边形栅格格式 向矢量格 式转换就是提取 以相同的 编号的栅格集合 表示的多 边形区域 的边界和边界的拓扑关系,并表示由多个小直线段组成的矢量格式边界线的过程。 1)步骤 栅格格式向矢量格式转换通常包括以下四个基本步骤: ( 1. 1)多边形边界提取:采用高通滤波将栅格图像二值化或以特殊值标识边界点; ( 1. 2) 边 界线 追踪 : 对 每 个边界 弧段 由一 个结 点向 另一个 结点 搜索 , 通 常 对 每个已 知 边界点需沿除了进入方向的其他 7 个方向搜索下一个边界点,直到连成边界弧段; ( 1. 3) 拓 扑关 系生 成: 对 于矢量 表示 的边 界弧 段数 据, 判断 其与 原图 上各 多 边形的 空 间关系,以形成完整的拓扑结构并建立与属性数据的联系; ( 1. 4) 去 除多 余点 及曲 线圆滑 : 由 于 搜 索 是 逐 个 栅格进 行的 , 必 须 去 除 由 此造成 的多 余点记 录, 以减 少数 据冗 余; 搜 索 结 果 , 曲 线 由 于 栅格精 度的 限制 可能 不够 圆滑, 需采 用一 定的插 补算 法进 行光 滑处 理, 常 用 的 算 法 有 : 线 形 迭代法 ; 分 段三 次多 项式 插值法 ; 正 轴抛 物线平均加权法;斜轴抛物线平均加权法;样条函数插值法。 2)多边形栅格转矢量的双边界搜索算法( DBDF-Double Boundary Direct Finding) 算法的 基本 思想 是通 过边 界提取 , 将 左右 多边 形信 息保存 在边 界点 上, 每条 边界弧 段由 两个并 行的 边界 链组 成, 分别记 录该 边界 弧段 的左 右多边 形编 号。 边界 线搜 索采 用 2*2 栅格 窗口, 在每 个窗 口内 的四 个栅格 数据 的模 式, 可以 唯一地 确定 下一 个窗 口的 搜索方 向和 该弧 段的拓扑关系,极大地加快了搜索速度,拓扑关系也很容易建立。具体步骤如下: ( 2. 1) 边 界点 和结 点提 取: 采用 2*2 栅格阵列 作 为窗口 顺序 沿行 、 列 方 向 对栅格 图像 全图扫 描 , 如 果窗口 内四 个栅格 有且 仅有 两个 不同 的编号 , 则 该 四个栅 格表 示为边 界点 ; 如 果窗口 内四个 栅格有 三个 以上不 同编号 ,则标 识为 结点( 即不同 边界弧 段的 交汇点) ,保 持 各栅格 原多 边形 编号 信息 。 对于对 角线 上栅 格两 两相 同的情 况 , 由于 造成 了多 边形 的 不 连 通 , 也当作结点处理。图 7-17 和图 7-18 给出了节点和边界点的各种情形。 a b c d (a) a a b c (b) a b c c (c) a b a c (d) a b c b (e) a b c a (f) a b b c (e) a b b a (g) 图 7-17:节点的 8 种情形 a a b b (a) a b a b (b) a a a b (c) a a b a (d) a b b b (e) a b a a (f) 图 7-18:边界点的 6 种情形 ( 2. 2) 边 界线 搜索 与左 右多边 形信 息记 录 : 边 界 线搜索 是逐 个弧 段进 行的 , 对 每个 弧 段由一 组已 标识 的四 个结 点开始 , 选定 与之 相邻 的任 意一组 四个 边界 点和 结点 都必定 属于 某 一窗口 的四 个标 识点 之一 。 首 先 记 录 开 始 边 界 点 的 两个多 边形 编号 , 作 为该 弧段的 左右 多边 形, 下 一 点 组 的 搜 索 方 向 则由进 入当 前点 的搜 索方 向和该 点组 的可 能走 向决 定, 每 个 边 界 点 组只能 有两 个走 向 , 一 个 是 前点组 进入 的方 向 , 另 一 个 则可确 定为 将要 搜索 后续 点组的 方向 。 例如图 7-18( c) 所 示 边 界 点组只 可能 有两 个方 向, 即下方 和右 方, 如果 该边 界点组 由其 下 方的一 点组 被搜 索到 , 则 其后续 点组 一定 在其 右方 ; 反 之, 如果 该点 在其 右 方的点 组之 后被 搜索到 (即 该弧 段的 左右 多边形 编号 分别 为 b 和 a) ,对其 后续 点组 的搜 索应 确定为 下方 , 其他情 况依 此类 推。 可见 双边界 结构 可以 唯一 地确 定搜索 方向 ,从 而大 大地 减少搜 索时 间 , 同时形 成的 矢量 结构 带有 左右多 边形 编号 信息 , 容 易建立 拓扑 结构 和与 属性 数据的 联系 , 提 高转换的效率。 ( 2. 3) 多 余 点 去 除 : 多 余 点的去 除基 于如 下思 想 : 在一个 边界 弧段 上的 连续 的三个 点, 如果在 一定程 度上可 以认 为在一 条直线 上(满 足直 线方程) ,则三 个点 中间一 点可以 被认为 上多余 的 , 予 以去除 。 多 余点是 由于 栅格 向矢 量转 换时逐 点搜 索边 界造 成的 (当 边界 为直 线 时) ,多余点去除算法可大量去除多余点,减少数据冗余。 5.空间索引机制 5. 1 索引概念 栅矢一 体化 空间 数据 结构 一个重 要的 研究 领域 是如 何建立 有效 的空 间索 引结 构。 目前 对 线要素 索引 结构 研究 较多 , 主 要 有 PMR 四叉 树、 带 树和桶 方法 等, 而面 要素 的索引 结构 主 要有四叉树和 R 树等。这些结构各有自己的应用领域和相对优势,同时也都存在着不足。 空间索引就是指 依据空间 对象的位置和形 状或空间 对象之间的某种 空间关系 按一定的 顺序排 列的 一种 数据 结构 , 其 中包 含空 间对象 的概 要信息 , 如 对 象的标 识 、 外接矩 形及 指向 空间对 象实 体的 指针 。 作 为一种 辅助 性的 空间 数据 结构, 空间 索引 介于 空间 操作算 法和 空间 对象之 间 , 它 通过筛 选作 用, 大量 与特 定空间 操作 无关的 空间 对象 被排 除, 从而提 高空 间 操 作的速 度和 效率 。空 间索 引的性 能的 优劣 直接 影响 空间数 据库 和地 理信 息系 统的整 体性 能 , 它是空 间数 据库 和地 理信 息系统 的一 项关 键技 术。 常见大 空间 索引 一般 是自 顶向下 、 逐 级划 分空间 的各 种数 据结 构空 间索引 ,比 较有 代表 性的 包括 BSP 树、 K-D-B 树、 R 树、 R+树和 CELL 树等。此外,结构较为简单的格网型空间索引有着广泛的应用。 5. 2 索引类型 5. 2. 1 格网型空间索引 格网型 空间 索引 思路 比较 简单了 , 容 易理 解和 实现。 其基本 思想 是将 研究 区域 用横竖 线 条划分 大小 相等 和不 等的 格网 , 记录 每一 个格 网所 包含 的 空 间 实体。 当 用 户 进 行 空间查 询时 , 首先计 算出 用户 查询 对象 所在格 网, 然后 再在 该网 格中快 速查 询所 选空 间实 体, 这 样 一 来 就 大大地加速了空间索引的查询速度。 5. 2. 2 BSP 树空间索引 BSP 树是 一种 二叉 树, 它 将空间 逐级 进行 一分 为二 的划分 (图 7-19) 。 BSP 树 能很好 地 与空间 数据 库中 空间 对象 的分布 情况 相适 应, 但对 一般情 况而 言, BSP 树 深 度较大 , 对 各种 操作均有不利影响。 图 7-19: BSP 树 5. 2. 3 KDB 树空间索引 KDB 树是 B 树向 多维 空间 的一种 发展 。它 对于 多维 空间中 的点 进行 索引 具有 较好的 动 态特性 , 删 除和 增加 空间 点对象 也可 以很 方便 地实 现; 其 缺 点 是 不 直 接 支 持 占据一 定空 间范 围的地 物要 素, 如二 维空 间中的 线和 面。 该缺 点可 以通过 空间 映射 或变 换的 方法部 分地 得到 解决。 空间 映射 或变 换就 是将 2n 维空 间中 的区 域变换 到 2n 维空 间中 的点 , 这 样 便 可 利 用 点 索引结 构来 对区 域进 行索 引, 原 始 空 间 的 区 域 查 询 便转化 为高 维空 间的 点查 询。 但 空 间 映 射 或变换 方法 仍然 存在 着缺 点: 高维 空间 的点 查询 要比 原始空 间的 点查 询困 难得 多; 经过 变换 , 原始空间中相 邻的区域有 可能在点空间 中距离变得 相当遥远,这 些都将影响 空间索引的 性 能。 5. 2. 4 R 树和 R+树 R 树根 据地 物的 最小 外包 矩形建 立( 图 7-20) , 可 以 直接对 空间 中占 据一 定范 围的空 间 对象进 行索 引 。 R 树 的 每 一个结 点 N 都对 应着 磁盘 页 D( N)和 区 域 I( N) , 如果结 点不 是 叶结点 ,则 该结 点的 所有 子结点 的区 域都 在区 域 I( N)的 范围 之内 ,而 且 存储在 磁盘 页 D ( N) 中 ; 如果结 点是 叶结 点, 那么 磁盘 页 D( N) 中 存储的 将是 区 域 I( N) 范 围内的 一系 列子区域,子区域紧紧围绕空间对象,一般为空间对象的外接矩形。 R 树 中 每 个 结 点 所 能 拥 有 的子结 点数 目是 有上 下限 的。 下限 保证 索引 对磁 盘空间 的 有 效 利用, 子结 点的 数目 小于 下限的 结点 将被 删除 ,该 结点的 子结 点将 被分 配到 其它的 结点 中 ; 设立上 限的 原因 是因 为每 一个结 点只 对应 一个 磁盘 页, 如果 某个 结点 要求 的空 间大于 一个 磁 盘页, 那么 该结 点就 要被 划分为 两个 新的 结点 , 原 来结点 的所 有子 结点 将被 分配到 这两 个新 的结点中。 由于 R 树 兄 弟 结点对 应的 空间区 域可 以重 叠, 因此 , R 树可 以较 容易 地进 行插 入 和 删 除操作 ; 但 正因 为区 域之 间有重 叠, 空间 索引 可能 要对多 条路 径进 行搜 索后 才能得 到最 后的 结果 , 因 此, 其空 间搜 索 的效率 较低 。 正 是 这 个 原 因促使 了 R+树( 图 7-21) 的产生 。 在 R+ 树中, 兄弟 结点 对应 的空 间区域 没有 重叠 , 而 没有 重叠的 区域 划分 可以 使空 间索引 搜索 的速 度大大 提高 ; 但 由于 在插 入和删 除空 间对 象时 要保 证兄弟 结点 对应 的空 间区 域不重 叠, 而使 插入和删除操作的效率降低。 图 7-20: R 树 图 7-21: R+树 5. 2. 5 CELL 树 考虑到 R 树和 R+在 插 入 、删除 和空 间搜 索效 率两 方面难 于兼 顾, CELL 树 应运而 生。 它在空 间划 分时 不再 采用 矩形作 为划 分的 基本 单位 , 而是采 用凸 多边 形来 作为 划分的 基本 单 位 , 具体 划分 方法 与 BSP 树有类 似之 处, 子空 间不 再相互 覆盖 。 CELL 树的磁 盘访问 次数 比 R 树和 R+树少 ,由 于磁 盘 访问次 数是 影响 空间 索引 性能的 关键 指标 ,故 CELL 树是比较优 秀的空间索引方法(图 7-22) 。 图 7-22: CELL 树 6.空间信息查询 目前大多数成熟 的商品化 地理信息系统软 件的查询 功能都可完美地 实现对空 间实体的 简单查 找 , 如 根据鼠 标所 指的空 间位 置 , 系统 可查 找出该 位置 的空 间实 体和 空间范 围 ( 由 若 干个空 间实 体组 成) 以及 它们的 属性 , 并显示 出该 空间对 象的 属性 列表 , 并 可以进 行有 关 统 计分析 。 该 查 询工作 可分 为两步 : 首 先 借助于 空间 索引 , 在 空间 数据库 中快 速检索 出被 选 空 间实体;然后,根据空间数据和属性数据的连接即可得到该空间实体的属性列表。 6. 1 基于属性特征查询 一般来 说, 基于 属性 信息 的查询 操作 主要 是在 属性 数据库 中完 成的 。 目 前大 多数的 地理 信息系 统软 件都 将属 性信 息存储 在关 系数 据库 中 , 而 发展成 熟的 关系 数据 库又 为我们 提供 了 完备的 数据 索引 方法 及信 息查询 手段 。 几乎 所有 的关 系数据 库管 理系 统都 支持 标准的 结构 化 查询语言。利用 SQL,我们可以在属性数据库中很 方便地实现属性信息的复 合条件查询, 筛选出满足条件的空间实体的标识值,再到空间数据库中根据标识值检索到该空间实体。 6. 2 基于空间关系和属性特征的查询( SQL) 空间实 体间 有着许 多空 间 关系( 包括 拓扑、 顺序 、 度量等 关系) 。在 实际应 用 过程中 , 用户往 往希 望地 理信 息系 统提供 一些 更能 直接 计算 空间实 体关 系的 功能 , 如用 户希望 查询 出 满足如下条件的城市: A 在某 条铁 路的 东部; B 距离该 铁路 不超 过 30 公里; C 城市 人 口大于 70 万; D 城市 选 择区域 是特 定的 多边 形。 整个查 询计 算涉 及了 空间 顺序关 系 ( 铁路 东部) 、 空 间距离 关系 (距 离该铁 路不 超过 30 公里 ) 、空间 拓扑 关系 (被 选城 市在特 定的 选择 区域 之内 ) 、属性 信息 查 询(城市人口大于 70 万) 。 就目前 成熟 的地 理信 息系 统而言 , 比 较系 统地 完成 上述查 询任 务还 较为 困难 。 为此, 众 多的地 理信 息系 统专 家提 出了“ 空间 查询 语言 ” ( Spatial Query Language) 以 作为解 决问 题 的方案,但仍处于理论发展和技术探索阶段。 6. 3 一种空间扩展 SQL 查询语言—— GeoSQL 查询、 检索 是地理 信息 系 统中使 用最 频繁 的功 能之 一, GIS 用户 提出 的大 部分问 题 都 可 以表达 为查 询形 式, 即空 间查询 语言 不仅 可以 使 GIS 用户 方便 地访 问、 查询 和处理 空间 数 据, 也可 以实 现空 间数 据 的安全 性和 完整 性控 制 。 相对于 一 般 SQL, 空 间扩展 SQL 主要增 加了空 间数 据类 型和 空间 操作算 子, 以满 足空 间特 征的查 询。 空间 特征 包含 空间属 性和 非空 间属性 , 空 间属 性由 特定 的 “ Location”字段来 表示。 空间数 据类 型除 具有 一般 的整型 、 实 型、 字符串 外, 还具 有下 列空 间数据 类型 : 点 类型 、 弧 段类型 、 不 封闭 的线 类型 、 ( Polygon)多 边形类 型 、图像 类型 、 复 杂空间 特征 类型 。以 上类 型是针 对 “位置 ” 字段而 言的 。 GeoSQL 中的空 间操 作算 子是 指带 有参数 的函 数。 通常 它以 空间特 征为 参数 ,返 回空 间特征 或数 值 。 空间操 作算 子主 要分 为两 类:一 元空 间操 作算 子和 二元空 间操 作算 子。 通常 ,标准 SQL 的 一般形式 为: SELECT…FROM…WHERE,分别对应关系操 作投影、笛卡尔积和选择 ,其 中, FROM 语 句 代 表 所 给 关系的 笛卡 尔积 , 也 就是 定义了 一个 单独 的关 系。 WHERE 语句 中 的选择 和 SELECT 语句 中 的投影 均作 用于 该关 系上 。 尽 管 GeoSQL 属于非过 程化文 本语 言, 但为使 操作 简单 方便 , 它 仍可以 借鉴 可视 化查 询语 言的特 点 , 即 使用图 符 、 列表框 等组 件来 尽量减少用户 的文本输入 ,同时也可防 止输入时由 于误记、语义 误解等产生 的语法错误 。 GeoSQL 的实现过程如图 7-23 所示。 用户界 面 GeoSQL 文本 解译程 序 空间 ODBC 空间数 据库 查询结 果( 图、 表) 调用 图 7-23: GeoSQL 的实现过程 地理学中的第一条法则,任何事物都与其它事情相关,但是距离近的事物比距离 远的关系更大。 Waldo Tobler 第八章 空间分析 导读:空间分析源于60年代地理和区域科学的计量革命,在开始阶段,主要是应用 定量(主要是统计)分析手段用于分析点、线、面的空间分布模式。后来更多的是 强调地理空间本身的特征、空间决策过程和复杂空间系统的时空演化过程分析。实 际上自有地图以来,人们就始终在自觉或不自觉地进行着各种类型的空间分析。如 在地图上量测地理要素之间的距离、方位、面积,乃至利用地图进行战术研究和战 略决策等,都是人们利用地图进行空间分析的实例,而后者实质上已属较高层次上 的空间分析。 地理信息系统集成了多学科的最新技术,如关系数据库管理,高效图形算法,插值, 区划和网络分析,为空间分析提供了强大的工具,使得过去复杂困难的高级空间分 析任务变得简单易行。目前绝大多数地理信息系统软件都有空间分析功能。空间分 析早已成为地理信息系统的核心功能之一,它特有的对地理信息(特别是隐含信息) 的提取、表现和传输功能,是地理信息系统区别于一般信息系统的主要功能特征。 空间分析是对分析空间数据有关技术的统称。根据作用的数据性质不同,可以分为: (1)基于空间图形数据的分析运算;(2)基于非空间属性的数据运算;(3)空间和 非空间数据的联合运算。空间分析赖以进行的基础是地理空间数据库,其运用的手 段包括各种几何的逻辑运算、数理统计分析,代数运算等数学手段,最终的目的是 解决人们所涉及到地理空间的实际问题,提取和传输地理空间信息,特别是隐含信 息,以辅助决策。 本章介绍GIS中实现空间分析的基本功能,包括空间查询与量算,缓冲区分析、叠 加分析、路径分析、空间插值、统计分类分析等,并描述了相关的算法,以及其中 的计算公式。 1.空间查询与量算 查询和定位空间对象,并对空间对象进行量算是地理信息系统的基本功能之一,它是地 理信息系统进行高层次分析的基础。在地理信息系统中,为进行高层次分析,往往需要查询 定位空间对象,并用一些简单的量测值对地理分布或现象进行描述,如长度,面积,距离, 形状等。实际上,空间分析首先始于空间查询和量算,它是空间分析的定量基础。 1. 1 空间查询 图形与属性互查是最常用的查询,主要有两类:第一类是按属性信息的要求来查询定位 空间位置,称为“属性查图形” 。如在中国行政区划图上查询人口大于 4000 万且城市人口大 于 1000 万的省有哪些, 这和一般非空间的关系数据库的 SQL 查询没有区别,查询到结果后, 再利用图形和属性的对应关系,进一步在图上用指定的显示方式将结果定位绘出。第二类是 根据对象的空间位置查询有关属性信息,称为“图形查属性”。如一般地理信息系统软件都 提供一个“ INFO”工具,让用户利用光标,用点选、画线、矩形、圆、不规则多边形等工 具选中地物,并显示出所查询对象的属性列表,可进行有关统计分析。该查询通常分为两步, 首先借助空间索引,在地理信息系统数据库中快速检索出被选空间实体,然后根据空间实体 与属性的连接关系即可得到所查询空间实体的属性列表。 在大多数 GIS 中,提供的空间查询方式有: 1)基于空间关系查询 空间实体间存在着多种空间关系,包括拓扑、顺序、距离、方位等关系。通过空间关系 查询和定位空间实体是地理信息系统不同于一般数据库系统的功能之一。如查询满足下列条 件的城市: g108g32在京沪线的东部 g108g32距离京沪线不超过 50 公里 g108g32城市人口大于 100 万 g108g32城市选择区域是特定的多边形; 整个查询计算涉及了空间顺序方位关系(京沪线东部),空间距离关系(距离京沪线不超过 50 公里),空间拓扑关系(使选择区域是特定的多边形),甚至还有属性信息查询(城市人 口大于 100 万)。 简单的面、线、点相互关系的查询包括: g108g32面面查询,如与某个多边形相邻的多边形有哪些。 g108g32面线查询,如某个多边形的边界有哪些线。 g108g32面点查询,如某个多边形内有哪些点状地物。 g108g32线面查询,如某条线经过(穿过)的多边形有哪些,某条链的左、右多边形是哪些。 g108g32线线查询,如与某条河流相连的支流有哪些,某条道路跨过哪些河流。 g108g32线点查询,如某条道路上有哪些桥梁,某条输电线上有哪些变电站。 g108g32点面查询,如某个点落在哪个多边形内。 g108g32点线查询,如某个结点由哪些线相交而成。 2)基于空间关系和属性特征查询 传统的关系数据库的标准 SQL 并不能处理空间查询,这是由于关系数据库技术的弱点 造成的,对于 GIS 而言,需要对 SQL 进行扩展。对于传统的 SQL,要实现空间操作,需要 将 SQL 命令嵌入一种编程语言中,如 C 语言;而新的 SQL 允许用户定义自己的操作,并嵌 入到 SQL 命令中。 3)地址匹配查询 根据街道的地址来查询事物的空间位置和属性信息是地理信息系统特有的一种查询功 能,这种查询利用地理编码,输入街道的门牌号码,就可知道大致的位置和所在的街区。它 对空间分布的社会、经济调查和统计很有帮助,只要在调查表中添了地址,地理信息系统可 以自动地从空间位置的角度来统计分析各种经济社会调查资料。另外这种查询也经常用于公 用事业管理,事故分析等方面,如邮政、通讯、供水、供电、治安、消防、医疗等领域。 1. 2 空间量算 1. 2. 1 几何量算 几何量算对不同的点、线、面地物有不同的含义: g108g32点状地物( 0 维) :坐标; g108g32线状地物( 1 维) :长度,曲率,方向; g108g32面状地物( 2 维) :面积,周长,形状,曲率等; g108g32体状地物( 3 维) :体积,表面积等。 一般的 GIS 软件 都具 有对 点、线 、面 状地 物的 几何 量算功 能, 或者 是针 对矢 量数据 结 构,或者是针对栅格数据结构的空间数据。 1)线的长度计算 线状地物对象最 基本的形 态参数之一是长 度。在矢 量数据结构下, 线表示为 点对坐标 ( X, Y)或( X, Y, Z)的序列,在不考虑比例尺情况下,线长度的计算公式为: ()()()[] g229g229 ? == +++ =?+?+?= 1 01 2 1 2 1 2 1 2 1 n i n i iiiiiii lZZYYXXL 对于复合线状地物对象,则需要在对诸分支曲线求长度后,再求其长度总和。 通过离 散坐 标点 对串 来表 达线对 象, 选择 反映 曲线 形状的 选点 方案 非常 重要 , 往 往 由 于 选点方 案不 同, 会带 来长 度计算 的不 同精 度问 题。 为提高 计算 精度 , 增 加点 的数目 , 会 对数 据获取 、 管 理 与分析 带来 额外的 负担 , 折中的 选点 方案是 在曲 线的 拐弯 处加 大点的 数目 , 在 平直段减少点数,以达到计算允许精度要求。 在栅格 数据 结构 里, 线状 地物的 长度 就是 累加 地物 骨架线 通过 的格 网数 目, 骨架线 通常 采用 8 方向连接,当连接方向为对角线方向时,还要乘上 2 。 2)面状地物的面积 面积是 面状 地物 最基 本的 参数 。 在 矢量 结构 下, 面 状地物 以其 轮廓 边界 弧段 构成的 多边 形表示的。对于没有空洞的简单多边形,假设有 N 个顶点,其面积计算公式为: ()()g247 g248 g246 g231 g232 g230 ?+?= g229 ? = ++ NN N i iiii yxyxyxyxS 11 2 1 11 2 1 所采用 的是 几何 交叉 处理 方法, 即沿 多边 形的 每个 顶点作 垂直 与 X 轴的 垂线 ,然后 计算 每 条边 、 它 的两 条垂 线及 这 两条垂 线所 截 得 X 轴 部 分 所包围 的面 积 , 所 求 出 的 面积的 代数 和, 即为多 边形 面积 。 对 于有 孔或内 岛的 多边 形, 可分 别计算 外多 边形 与内 岛面 积, 其差 值为 原 多边形面积。此方法亦适合于体积的计算。 对于栅 格结 构, 多边 形面 积计算 就是 统计 具有 相同 属性值 的格 网数 目。 但对 计算破 碎多 边形的 面积 有些 特殊 , 可 能需要 计算 某一 个特 定多 边形的 面积 , 必须进 行再 分类 , 将 每个 多 边形进行分割赋给单独的属性值,之后再进行统计。 1. 2. 2 形状量算 面状地 物形 状量 测的 两个 基本考 虑: 空间 一致 性问 题, 即 有 孔 多 边 形 和 破 碎 多边形 的处 理;多边形边界特征描述问题。 度量空 间一 致性 最常 用的 指标是 欧拉 函数 , 用 来计 算多边 形的 破碎 程度 和孔 的数目 。 欧 拉函数的结果是一个数,称为欧拉数。欧拉函数的计算公式为: 欧拉数 =(孔数) -(碎片数 -1) 图 8-1 表示了多边形的三种可能的情形。 图 8-1:欧拉数 对于图 (a),欧拉数 =4-(1-1)=4 或欧 拉数 =4-0=4;对于 图 (b)欧拉数 =4-(2-1)=3 或 欧拉数 =4-1=3;图 (c)欧拉数 =5-(3-1)=3。 关于多 边形 边界 描述 的问 题, 由 于 面 状 地 物 的 外 观 是复杂 多变 的, 很难 找到 一个准 确的 指标进 行描 述。 最常 用的 指标包 括多 边形 长、 短轴 之比, 周长 面积 比, 面积 长度比 等。 其中 绝大多 数指 标是 基于 面积 和周长 的。 通常 认为 圆形 地物既 非紧 凑型 也非 膨胀 型, 则 可 定 义 其 形状系数 r 为: A P r ? = π2 其中 P 为地物周长, A 为面积。如果 r<1 为紧凑型; r=1 为标准圆; r>1 为膨胀型。 1. 2. 3 质心量算 质心是 描述 地理 对象 空间 分布的 一个 重要 指标 。 例如 要得到 一个 全国 的人 口分 布等值 线 图, 而人 口数 据只 能到 县级, 所以 必须 在每 个县 域里 定 义一个 点作 为质 心, 代表 该 县的数 值, 然后进 行插 值计 算全 国人 口等值 线。 质心 通常 定义 为一个 多边 形或 面的 几何 中心, 当多 边形 比较简单,比如矩形,计算很容易。但当多边形形状复杂时,计算也更加复杂。 在某些 情况 下, 质心 描述 的是分 布中 心, 而不 是绝 对几何 中心 。 同 样以 全国 人口为 例, 当某 个县绝 大部 分人 口明 显集 中于一 侧时 , 可 以把 质心 放在分 布中 心上 , 这 种质 心称为 平均 中心 或重心 。 如 果考 虑其 它一 些因素 的话 , 可 以赋 予权 重系数 , 称 为加 权平 均中 心。 计 算 公 式 是 : g229 g229 = i i i ii G W XW X g229 g229 = i i i ii G W YW Y 其中, W i 为第 i个离散目标物权重, X i , Y i 为第 i个离散目标物的坐标。 质心量 测经 常用 于宏 观经 济分析 和市 场区 位选 择, 还可以 跟踪 某些 地理 分布 的变化 , 如 人口变迁,土地类型变化等。 1. 2. 4 距离量算 “距离 ” 是 人们 日常 生活 中经常 涉及 到的 概念 , 它 描述了 两个 事物 或实 体之 间的远 近程 度 。 最常 用的 距离 概念 是欧 氏 距 离 , 无 论 是 矢 量 结 构 , 还是 栅格 结构 都很 容易 实 现 。 在 GIS 中,距 离通 常是 两个 地点 之间的 计算 ,但 有时 人们 想知道 一个 地点 到所 有其 它地点 的距 离 , 这时得 到的 距离 是一 个距 离表面 。 如 果一 区域 中所 有的性 质与 方向 无关 , 则 称为各 向同 性区 域。 以旅 行时 间为例 , 如 果从某 一点 出发 , 到 另一 点的所 耗费 的时 间只 与两 点之间 的欧 氏距 离成正 比 , 则 从一固 定点 出发 , 旅 行特 定时间 后所 能达到 的点 必然 组成 一个 等时圆 。 而 现 实 生活中 , 旅 行所 耗费 的时 间不只 与欧 氏距 离成 正比 , 还 与 路 况 、 运 输 工 具 性 能等有 关, 从固 定点出 发, 旅行 特定 时间 后所能 到达 的点 则在 各个 方向上 是不 同距 离的 , 形 成各向 异性 距离 表面。 (图 8-2) (各向同性表面) 简单距离 耗费距离 高阻力 低阻力 图 8-2:各向同性和各向异性的距离表面 考虑到 阻力 影响 , 计 算的 距离称 为耗 费距 离。 物质 在空间 中移 动总 要花 费一 些代价 , 如 资金 、 时 间等 。 阻 力越 大 耗费也 越大 。 相应的 通过 耗费距 离得 到的 距离 表面 称为阻 力表 面或 耗费表面,其属性值代表一耗费或阻力大小。可以根据阻力表面计算最小耗费距离。 对于描 述点 、 线 、 面 坐标 的矢量 结构 , 也 有 一 系 列 的不同 于欧 氏距 离的 概念 。 欧 氏距 离 通常用于计算两点的直线距离: ()() 22 jiji YYXXd ?+?= 当有障 碍或 阻力 存在 时, 两点之 间的 距离 就不 能用 直线距 离, 计算 非标 准欧 氏距离 的一 般公式为: ()()[] k k ji k ji YYXXd 1 ?+?= 当 k=2 时, 就是 欧氏 距离 计算公 式。 当 k=1 时 , 得 到的距 离称 为曼 哈顿 距离 。欧氏 距 离、曼哈顿距离和非欧氏距离的计算如图 8-3 所示。 (Xi, Yi ) (Xj, Yj ) ()() 22 jiji YYXXd ?+?= jiji YYXXd ?+?= ()() [] 6.01 6.06.0 jiji YYXXd ?+?= 欧式距离 曼哈顿距离 非欧式距离 图 8-3:欧氏距离、曼哈顿距离和一种非欧氏距离 2.空间变换 地理信 息系 统通 常是 按有 一定意 义的 图层 和相 应的 属性建 立空 间数 据库 的 。 为 了满足 特 定空间 分析 的需 要, 需对 原始图 层及 其属 性进 行一 系列的 逻辑 或代 数运 算, 以产生 新的 具有 特殊意 义的 地理 图层 及其 属性, 这个 过程 称为 空间 变换。 空间 变换 可以 基于 单个图 层进 行 , 也可以 对多 个图 层, 本章 将空间 变换 仅限 于对 单个 图层的 操作 或计 算, 基于 多图层 的操 作 , 将在叠加分析里讲述。 地理信 息系 统中 空间 数据 可分为 矢量 和栅 格两 种数 据结构 。 由于 矢量 结构 中包 含了大 量 的拓扑 信息 , 数 据组 织复 杂, 使 得 空 间 变 换 十 分 繁 琐 。 而 栅格 结构 简单 规则 , 空 间 变 换 比 较 容易 。 另 外基 于矢量 结构 的空间 变换 , 对于单 个图 层意义 不大 , 生成新 图层 时往往 需要 多 个 图层的信息,在多图层叠加分析中意义很大。 基于栅 格结 构的 空间 变换 可分为 三种 方式 : ( 1) 单 点变换 ; ( 2) 邻 域变 换; ( 3)区 域 变 换。 单点变 换只 考虑 单个 点的 属性值 进行 运算 , 假定 独立 单元的 变换 不依 赖于 其邻 点上属 性 的影响 , 也 不受 区域 内一 般特征 的影 响。 单点 变换 最常见 的函 数有 加、 减、 乘、 除 等 代 数 运 算 ; 与、 并、 非 、 异 或等逻 辑 运算; 大于、 小于 等比 较 运算; 指数 函数, 对数 函 数 、 三 角函 数等。其得到的新图层可与原图层属性意义完全不同。 邻域变 换是 指在 计算 新图 层图元 值时 , 不 仅考 虑原 始图层 上相 应图 元本 身的 值, 而 且 还 要考虑 与该 图元 有邻 域关 联的其 它图 元值 的影 响。 这种关 联可 以是 直接 的几 何关联 , 也 可能 是间接 的几 何关 联。 常 见 的函数 有平 滑、 离 散 点 搜 索 、 连 续表面 描述 ( 坡 度 、 坡向、 可视 域 分析) 、点在多边形中的判断等。 区域变 换是 指在 计算 新图 层属性 值时 , 要 考虑 整个 区域的 属性 值, 即通 过一 个函数 对某 一区域 内的 所有 值进 行综 合, 然 后 计 算 新 属 性 值 。 常 见的函 数有 求区 域平 均值 、 众数, 极值 、 求和、归组、整体插值等方法。 3.再分类 通过分 类找 出隐 藏信 息是 地理信 息系 统的 重要 功能 之一。 与传 统地 图相 比, 地 图上所 载 负的数 据是 经过 专门 分类 和处理 过的 ,而 地理 信息 系统存 储的 数据 则具 有原 始数据 的性 质 , 所以可 以根 据不 同的 需要 对数据 再进 行分 类和 提取 。 由于这 种分 类是 对原 始数 据进行 的再 次 分类组织,因此称为再分类( Reclassification) 。 地理信 息系 统区 别于 其它 信息系 统的 方面 是其 对空 间信息 的处 理功 能 , 同 时 也 提供了 对 非空间 属性 的处 理功 能, 尽管比 较简 单 , 但它 在实 际应用 中有 着重 要的 作用 。 根 据地 理信 息 的非空 间属 性, 如材 料、 价 值 、 使 用性 质等, 进行 再分 类, 这 种 纯 粹 基 于 非 空 间 属性的 分类 , 与其它 信息 系统 对简 单结 构化的 数据 进行 分类 的方 法是一 样的 , 可以 使用 经典 的数理 统计 方 法, 如 主成分 分析、 层次 分析、 聚类分 析、 判 别 分 析等等。 这种 分类 属于 普 通的分 类, 它 不 改变地 物已 有的 属性 值, 而只是 根据 地物 的属 性, 将它们 划分 到相 应的 类别 中。 本章 主要 论 述 GIS 中通过地物属性信息,经过分类组织产生新地物特征的再分类。 点、 线状 地物 的再 分类, 对 于矢量 数据 结构 可以 通过 简单的 修改 属性 表中 的数 值来实 现, 对于栅 格数 据结 构也 可以 通过修 改属 性值 来获 得新 的点 、 线 地物 。 面 状地 物 的再分 类 , 对 于 栅格数 据结 构则 和点 、 线 分类一 样 , 简 单的改 变属 性数值 并改 变图 例表 现这 一变化 。 例 如 有 一个栅 格图 , 属性值 从 1 到 15 分别 代表 一种 农作 物 , 如 果 1 到 5 及 13 为 粮食作 物, 其它 代 表经济 作物 , 可 将 1 到 5 和 13 重新 赋值 1, 其 它数赋 值 2, 则 可得 到只 有粮 食 作物和 经济 作 物两类 地物 的栅 格图 , 并 改变图 例体 现这 一变 化。 对于矢 量数 据结 构的 面状 地物再 分类 , 则 需要同时改变 实体的几何 形状和属性。 首要的任务 是去掉将要合 并的多边形 之间的分界 线 ( Line Dissolve) ,再把这两个多边形的属性值变为同一属性。如图 8-4 所示: 图 8-4:多边形的合并 因为对面 状地物的 再分类 得到的新 图层的类 别比原 图层少, 称为归组 ( Group) ,它是 最常用 和最 简单 的再 分类 。 如 果 想 把 面 状 地 物 进 一 步分解 成不 同类 别的 地物 , 就 不 能 用 此 方 法,因为不能知道界线的位置,可使用另一个图层,通过多边形叠加方法来实现 * 。 上面讲 的再 分类 方法 , 都 是只根 据面 状地 物本 身的 属性, 通过 重新 改变 属性 值而实 现分 类的目 的, 当然 也可 以结 合邻域 范围 的属 性值 进行 再分类 。 如 坡度 计算 , 缓 冲区计 算。 再分 类还可以综合多个图层的属性信息,如图 8-5 所示。 * 关于多边形叠加将在下面章节论述。 图 8-5:多个属性的再分类 4.缓冲区分析 邻近度 ( Proximity) 描述了地理空 间中 两个 地物 距离 相近的 程度 , 其 确定 是空 间分析 的 一个重 要手 段。 交通 沿线 或河流 沿线 的地 物有 其独 特的重 要性 , 公 共设 施 ( 商场, 邮局 , 银 行, 医 院 , 车 站, 学 校 等 ) 的服 务半 径, 大 型 水 库 建设引 起的 搬迁 , 铁 路, 公路以 及航 运河 道对其 所穿 过区 域经 济发 展的重 要性 等, 均是 一个 邻近度 问题 。 缓 冲区 分析 是解决 邻近 度问 题的空间分析工具之一 。 所谓缓 冲区 就是 地理 空间 目标的 一种 影响 范围 或服 务范围 。 从 数学 的角 度看, 缓冲区 分 析的基 本思 想是 给定 一个 空间对 象或 集合 , 确定 它们的 邻 域 , 邻域 的大 小由 邻域半 径 R决定 。 因此对象 O i 的缓冲区定义为: (){}ROxdxB ii ≤= ,: 即对象 O i 的半径为 R的缓 冲区为距 O i 的距离 d小于 R的全部点的 集合。 d一般是 最小欧氏 距 离,但也可是其它定义的距离。对于对象集合 {}niOO i ,,2,1: ???== 其半径为 R 的缓冲区是各个对象缓冲区的并,即: g85 n i i BB 1= = 图 8-6 为点对象、线对象、面对象及对象集合的缓冲区示例。 图 8-6:点、线、多边形的缓冲区 另外还 有一 些特 殊形 态的 缓冲区 , 如 点对 象有 三角 形, 矩 形 和 圈 形 等 , 对 于线 对象有 双 侧对称 , 双 侧 不对称 或单 侧缓冲 区 , 对 于面对 象有 内侧和 外侧 缓冲 区。 这些 适合不 同应 用 要 求的缓冲区,尽管形态特殊,但基本原理是一致的。 缓冲区 计算 的基 本问 题是 双线问 题 。 双线 问题 有很 多另 外 的 名 称 , 如图 形加 粗 , 加宽线 , 中心线扩张等,它们指的都是相同的操作。 1)角分线法 双线问 题最 简单的 方法 是 角分线 法( 简单平 行线 法) 。算法 是在 轴线首 尾点 处 ,作轴 线 的垂线 并按 缓冲 区半 径 R 截出左 右边 线的 起止 点; 在轴线 的其 它转 折点 上, 用与该 线所 关 联的前 后两 邻边 距轴 线的 距离为 R的 两 平 行 线 的 交 点来生 成缓 冲区 对应 顶点 。 如图 8-7所示 。 图 8-7:角平分线法 角分线法的缺点 是难以最 大限度保证双线 的等宽性 ,尤其是在凸侧 角点在进 一步变锐 时,将远离轴线顶点。根据上图,远离情况可由下式表示: ()2sin BRd = 当缓冲 区半 径不 变时 , d 随张 角 B 的减 小而 增大 , 结果在 尖角 处双 线之 间的 宽度遭 到破 坏 。 因此, 为克 服角 分线 法的 缺 点 , 要有 相应 的补 充判 别方案 , 用于 校正 所出 现的 异常情 况 。 但由于异常情况不胜枚举,导致校正措施繁杂。 2)凸角圆弧法 在轴线 首尾 点处 , 作 轴线 的垂线 并按 双线 和缓 冲区 半径截 出左 右边 线起 止点 ; 在 轴 线 其 它转折 点处 , 首先判 断该 点的凸 凹性 , 在凸侧 用圆 弧弥合 , 在 凹 侧则用 前后 两邻边 平行 线 的 交 点 生 成 对 应 顶 点 。 这 样 外 角 以 圆 弧 连 接,内角 直接 连 接,线段 端点 以半 圆封 闭 。 如 图 8-8 所示。 图 8-8:凸角圆弧法 在凹侧平行边线相交在角分线上。交点距对应顶点的距离与角分线法类似公式: ()2sin BRd = 该方法最大限度的保证了平行曲线的等宽性,避免了角分线法的众多异常情况。 该算法 非常 重要 的一 环是 折点凸 凹性 的自 动判 断。 此问题 可转 化为 两个 矢量 的叉积 : 把 相邻两 个线 段看 成两 个矢 量, 其 方 向 取 坐 标 点 序 方 向 。 若 前一 个矢 量以 最小 角度扫 向第 二个 矢量时呈逆时针方向,则为凸顶点,反之为凹顶点。具体算法过程如下: 由矢量代数可知,矢量 AB, BC 可用其端点坐标差表示( 9-9) : S A B C a b 图 8-9:采用向量叉乘判断向量排列 ()() yxABAB aaYYXXAB ,, =??= ()() yxBCBC bbYYXXBC ,, =??= () ()()()( ABBCBCAB yxyx YYXXYYXX abbabaBCABS ?????= ?=×=×= ) 矢量代数叉积遵循右手法则,即当 ABC 呈逆时针方向时, S 为正,否则为负。 若 S>0,则 ABC 呈逆时针,顶点为凸; 若 S<0,则 ABC 呈顺时针,顶点为凹; 若 S=0,则 ABC 三点共线。 对于简 单情 形, 缓冲 区是 一个简 单多 边形 , 但 当计 算形状 比较 复杂 的对 象或 多个对 象集 合的缓 冲区 时 , 就复 杂得 多。 为使 缓冲 区算法 适应 更为普 遍的 情况 , 就 不得 不处理 边线 自 相 交的情 况。 当轴 线的 弯曲 空间不 容许 双线 的边 线无 压盖地 通过 时, 就会 产生 若干个 自相 交多 边形。图 8-10 给出一个缓冲区边线自相交的例子。 图 8-10:缓冲区边界相交的情况 自相交 多边 形分 为两 种情 况: 岛 屿 多 边 形 和 重 叠 多 边形。 岛屿 多边 形是 缓冲 区边线 的有 效组成 部分 ; 重叠多 边形 不是缓 冲区 边线 的有 效组 成, 不参 与缓 冲区边 线的 最终重 构 。 对 于 岛屿多 边形 和重 叠多 边形 的自动 判别 方法 , 首 先定 义轴线 坐标 点序 为其 方向 , 缓 冲 区 双 线 分 成左右 边线 , 左右边 线自 相交多 边形 的判 别情 形恰 好对称 。 对 于 左边线 , 岛 屿自相 交多 边形 呈逆时 针方 向, 重叠 自相 交多边 形呈 顺时 针方 向; 对于右 边线 ,岛 屿多 边形 呈顺时 针方 向 , 重叠多边形呈逆时针方向。 当存在 岛屿 和重 叠自 相交 多边形 时, 最终 计算 的边 线被分 为外 部边 线和 若干 岛屿。 对于 缓冲区 边线 绘制 , 只 要把 外围边 线和 岛屿 轮廓 绘出 即可 。 对 于缓 冲区检 索 , 在外边 线所 形成 的多边形检索后,要再扣除所有岛屿多边形的检索结果。 基于栅 格结构也可以作 缓冲区分 析,通常称为推移或扩散 ( Spread) 。推移或扩散实 际 上是模 拟主 体对 邻近 对象 的作用 过程 , 物 体在 主体 的作用 下在 一阻 力表 面移 动, 离 主 体 越 远 作用力 越弱 。 例 如可 以将 地形、 障碍 物和 空气 作为 阻力表 面, 噪声 源为 主体 , 用 推 移 或 扩 散 的方法计算噪 声离开主体 后在阻力表面 上的移动, 得到一定范围 内每个栅格 单元的噪声 强 度。 5.叠加分析 大部 分 GIS 软件 是以 分层 的方式 组织 地理 景观 ,将 地理景 观按 主题 分层 提取 ,同一 地 区的整 个数 据层 集表 达了 该地区 地理 景观 的内 容。 每个主 题层 , 可以叫 做一 个数据 层面 。 数 据层面 既可 以用 矢量 结构 的点 、 线 、 面 图层 文件 方 式表达 , 也 可 以用栅 格结 构的图 层文 件格 式进行表达。 叠加分 析是 地理 信息 系统 最常用 的提 取空 间隐 含信 息的手 段之 一 。 该方 法源 于传 统 的 透 明材料 叠加 , 即将来 自不 同的数 据源 的图 纸绘 于透 明纸上 , 在 透 光桌上 将其 叠放在 一起 , 然 后用笔 勾出 感兴 趣的 部分 —提取 出感 兴趣 的信 息 。 地 理信息 系统 的叠 加分 析是 将有关 主题 层 组成的 数据 层面 , 进 行叠 加产生 一个 新数 据层 面的 操作, 其结 果综 合了 原来 两层或 多层 要素 所具有 的属 性 。 叠加 分析 不仅包 含空 间关 系的 比较 , 还 包含 属性 关系的 比较 。 地 理信 息系 统 叠加分 析可 以分 为以 下几 类: 视 觉 信 息 叠 加 、 点 与 多边形 叠加 、 线 与多 边形 叠加、 多边 形叠 加、栅格图层叠加。 5. 1 视觉信息叠加 视觉信息叠加是将不同侧面的信息内容叠加显示在结果图件或屏幕上,以便研究者判断 其相互空间关系,获得更为丰富的空间信息。地理信息系统中视觉信息叠加包括以下几类: g108g32点状图,线状图和面状图之间的叠加显示。 g108g32面状图区域边界之间或一个面状图与其他专题区域边界之间的叠加。 g108g32遥感影象与专题地图的叠加。 g108g32专题地图与数字高程模型(DEM)叠加显示立体专题图。 视觉信息叠加不产生新的数据层面,只是将多层信息复合显示,便于分析。 5. 2 点与多边形叠加 点与多边形叠加,实际上是计算多边形对点的包含关系。矢量结构的 GIS 能够通过计 算每个点相对于多边形线段的位置,进行点是否在一个多边形中的空间关系判断。 在完成点与多边形的几何关系计算后,还要进行属性信息处理。最简单的方式是将多边 形属性信息叠加到其中的点上。 当然也可以将点的属性叠加到多边形上, 用于标识该多边形, 如果有多个点分布在一个多边形内的情形时,则要采用一些特殊规则,如将点的数目或各点 属性的总和等信息叠加到多边形上。 通过点与多边形叠加,可以计算出每个多边形类型里有多少个点,不但要区分点是否在 多边形内,还要描述在多边形内部的点的属性信息。通常不直接产生新数据层面,只是把属 性信息叠加到原图层中,然后通过属性查询间接获得点与多边形叠加的需要信息。例如一个 中国政区图(多边形)和一个全国矿产分布图(点),二者经叠加分析后,并且将政区图多 边形有关的属性信息加到矿产的属性数据表中,然后通过属性查询,可以查询指定省有多少 种矿产,产量有多少;而且可以查询,指定类型的矿产在哪些省里有分布等信息。 5. 3 线与多边形叠加 线与多边形的叠加,是比较线上坐标与多边形坐标的关系,判断线是否落在多边形内。 计算过程通常是计算线与多边形的交点,只要相交,就产生一个结点,将原线打断成一条条 弧段,并将原线和多边形的属性信息一起赋给新弧段。叠加的结果产生了一个新的数据层面, 每条线被它穿过的多边形打断成新弧段图层,同时产生一个相应的属性数据表记录原线和多 边形的属性信息。根据叠加的结果可以确定每条弧段落在哪个多边形内,可以查询指定多边 形内指定线穿过的长度。如果线状图层为河流,叠加的结果是多边形将穿过它的所有河流打 断成弧段,可以查询任意多边形内的河流长度,进而计算它的河流密度等;如果线状图层为 道路网,叠加的结果可以得到每个多边形内的道路网密度,内部的交通流量,进入、离开各 个多边形的交通量,相邻多边形之间的相互交通量。 5. 4 多边形叠加 多边形叠加是 GIS 最常用的功能之一。多边形叠加将两个或多个多边形图层进行叠加 产生一个新多边形图层的操作,其结果将原来多边形要素分割成新要素,新要素综合了原来 两层或多层的属性。如图 8-11 所示: 图 8-11:多边形叠加分析 进行多 个多 边形 的叠 加运 算,在 参与 运算 多边 形所 构成的 属性 空间 (就 图 10 而言, 为 宗地 ID, 宗 地号 ,土壤 ID, 稳 定 性 ) 内 , 每 个 结 果 多边形 内部 的属 性值 是一 致的, 可以 称 为最小 公共地理单元( Least Common Geographic Unit,LCGU) 。 叠加过 程可 分为 几何 求交 过程和 属性 分配 过程 两步 。 几何求 交过 程首 先求 出所 有多边 形 边界线 的交 点, 再根 据这 些交点 重新 进行 多边 形拓 扑运算 , 对 新生 成的 拓扑 多边形 图层 的每 个对象 赋一 多边 形唯 一标 识码, 同时 生成 一个 与新 多边形 对象 一一 对应 的属 性表。 由于 矢量 结构 的有限精度原 因,几何对 象不可能完全 匹配,叠加 结果可能会出 现一些碎屑 多边形 ( Silver Polygon) ,如图 8-12 所示。通常可以设定一模糊容限以消除它。 叠加生 成 碎屑多 边形 T2 时刻 多边 形 多边形 叠加 结果 T1 时刻 多边 形 图 8-12:多边形叠加产生碎屑多边形 多边形 叠加 结果 通常 把一 个多边 形分 割成 多个 多边 形, 属性 分配 过程 最典 型的 方法是 将 输入图 层对 象的 属性 拷贝 到新对 象的 属性 表中 , 或 把输入 图层 对象 的标 识作 为外键 , 直 接关 联到输 入图 层的 属性 表。 这种属 性分 配方 法的 理论 假设是 多边 形对 象内 属性 是均质 的, 将它 们分割后,属性不变。也可以结合多种统计方法为新多边形赋属性值。 多边形 叠加 完成 后, 根据 新图层 的属 性表 可以 查询 原图层 的属 性信 息, 新生 成的图 层和 其它图层一样可以进行各种空间分析和查询操作。 根据叠 加结 果最 后欲 保留 空间特 征的 不同 要求 ,一 般的 GIS 软件都 提供 了三 种类型 的 多边形叠加操作,如图 8-13 所示: 交 只 保 留 两个输 入图 层 的 公 共 区 域 叠和 以输 入图层 为界 , 保留 边界内 两个 多 边形 的所有 多边 形 输入 图层 叠加图 层 并 保留 两个输 入图 层 的 所 有 多 边 形 结果 图层 图 8-13:多边形的不同叠加方式 5. 5 栅格图层叠加 栅格数 据结 构空 间信 息隐 含属性 信息 明显 的特 点, 可以看 作是 最典 型的 数据 层面, 通过 数学关 系建 立不 同数 据层 面之间 的联 系是 GIS 提供 的典型 功能 。空 间模 拟尤 其需要 通过 各 种各样 的方 程将 不同 数据 层面进 行叠 加运 算, 以揭 示某种 空间 现象 或空 间过 程。 例 如 土 壤 侵 蚀强度 与土 壤可 蚀性 , 坡 度, 降 雨 侵 蚀 力 等 因 素 有 关 , 可 以根 据多 年统 计的 经验方 程, 把土 壤可蚀 性、 坡度 、降 雨侵 蚀力作 为数 据层 面输 入, 通过数 学运 算得 到土 壤侵 蚀强度 分布 图 。 这种作 用于 不同 数据 层面 上的基 于数 学运 算的 叠加 运算, 在地 理信 息系 统中 称为地 图代 数 。 地图代数功能有三种不同的类型: g108g32基于常数对数据层面进行的代数运算; g108g32基于数学变换对数据层面进行的数学变换(指数、对数、三角变换等) ; g108g32多个数 据层 面的 代数 运算 (加、 减、 乘、 除、 乘方 等)和 逻辑 运算 (与 、或 、非 、 异或等) 。 下面给出一个地图代数的典型例子。有一个森林地区融雪经验模型: M=( 0.19T+0.17D) 式中 , M 是融 雪速 度 ( 厘 米 /天) , T 是空 气温 度, D 是 露 点 温 度 。 根 据此 方程, 使用 该 地区的 气温 和露 点温 度分 布图层 , 就 能计 算该 地区 融雪速 率分 布图 。 计 算过 程是先 分别 把温 度分布 图乘 以 0.19 和露 点 温度分 布图 乘 以 0.17, 再 把得到 的结 果相 加。 需要 说明的 是地 图 代数在 形式 和概 念上 都比 较简单 , 使 用起 来方 便灵 活, 但 把 图 层 作 为 代 数 公 式的变 量进 行计 算,在实现的技术上难度较大。 栅格图 层叠 加的 另一 形式 是二值 逻辑 叠加 , 常 作为 栅格结 构的 数据 库查 询工 具。 数 据 库 查询就 是查 找数 据库 中已 有的信 息 , 例 如 : 基 于 位 置信息 查询 如已 知地 点的 土地类 型 , 以 及 基于属 性信 息的 查询 如地 价最高 的位 置; 比较 复杂 的查询 涉及 多种 复合 条件 , 如 查 询 所 有 的 面积大 于 10 公顷 且邻 近工 业区的 全部 湿地 。这 种数 据库查 询通 常分 为两 步, 首先进 行再 分 类(见第三节)操作,为每个条件创建一个新图层,通常是二值图层, 1 代表符合条件, 0 表示所有不符合条件。第二步进行二值逻辑叠加操作得到想查询的结果。逻辑操作类型包括 与、或、非、异或。 6.网络分析 对地理网络(如交通网络)、城市基础设施网络(如各种网线、电力线、电话线、供排 水管线等)进行地理分析和模型化,是地理信息系统中网络分析功能的主要目的。网络分析 是运筹学模型中的一个基本模型,它的根本目的是研究、筹划一项网络工程如何安排,并使 其运行效果最好,如一定资源的最佳分配,从一地到另一地的运输费用最低等。其基本思想 则在于人类活动总是趋于按一定目标选择达到最佳效果的空间位置。这类问题在社会经济活 动中不胜枚举,因此在地理信息系统中此类问题的研究具有重要意义。 6. 1 网络数据结构 网络数据结构的基本组成部分和属性如下: 1)链(Link ) 网络中流动的管线,如街道、河流、水管等,其状态属性包括阻力和需求。 2)结点(Node ) * 网络中链的结点,如港口、车站、电站等,其状态属性包括阻力和需求等。结点中又有 下面几种特殊的类型。 g108g32障碍( Barrier),禁止网络中链上流动的点。 g108g32拐点( Turn),出现在网络链中的分割结点上,状态属性有阻力,如拐弯的时间和 限制(如在 8: 00 到 18: 00 不允许左拐)。 g108g32中心( Center),是接受或分配资源的位置,如水库、商业中心、电站等,其状态 属性包括资源容量(如总量),阻力限额(中心到链的最大距离或时间限制)。 g108g32站点( Stop),在路径选择中资源增减的结点,如库房、车站等,其状态属性有资 源需求,如产品数量。 除了基本的组成部分外,有时还要增加一些特殊结构,如邻接点链表用来辅助进行路径 分析。 6. 2 主要网络分析功能 6. 2. 1 路径分析 1)静态求最佳路径:在给定每条链上的属性后,求最佳路径。 2) N 条最佳路径分析:确定起点或终点,求代价最小的 N 条路径,因为在实践中最佳 路径的选择只是理想情况,由于种种因素而要选择近似最优路径。 3)最短路径或最低耗费路径:确定起点、终点和要经过的中间点、中间连线,求最短 * 在图数据结构中称为“弧”。 路径或最小耗费路径。 4)动态 最佳路 径分析 :实 际网络中 权值 是随权 值关 系式变化 的, 可能还 会临 时出现 一 些障碍点,需要动态的计算最佳路径。 6. 2. 2 计算最短路径的 Dijkstra 算法 为了进 行网 络最 短路 径分 析, 需 要 将 网 络 转 换 成 有 向图。 无论 是计 算最 短路 径还是 最佳 路径, 其算 法都 是一 致的, 不同之 处在 于有 向图 中每 条弧的 权值 设置 。 如 果 要 计 算最短 路径 , 则权重 设置 为两 个节 点的 实际距 离; 而要 计算 最佳 路径, 则可 以将 权值 设置 为从起 点到 终点 的时间 或费 用。 Dijkstra 算 法可以 用于 计算 从有 向图 中任意 一个 节点 到其 它节 点的最 短路 径。 下面是该算法的描述。 1)用带 权的邻 接矩阵 Cost来表示带 权的 n个节点 的有 向图, Cost[i,j]表示 弧 <v i ,v j >的权 值,如 果从 v i 到 v j 不 连 通,则 Cost[i,j]=∞ 。图 8-14 表 示了一 个带 权有 向图 以及 其邻接 矩阵 。 1 0 5 3 10 5 100 30 60 10 20 ∞ ∞ 10 ∞ 30 100 ∞ ∞ 5 ∞ ∞ ∞ ∞ ∞ ∞ 50 ∞ ∞ ∞ ∞ ∞ ∞ ∞ 10 ∞ ∞ ∞ 20 ∞ 60 ∞ ∞ ∞ ∞ ∞ ∞ 4 2 50 图 8-14:带权的有向图和邻接矩阵 然后 , 引 进一 个辅 助向 量 Dist,每 个 分 量 Dist[i]表 示 从 起始点 到每 个终 点 v i 的最短 路径长 度。假定起始点在有向图中的序号为 i0,并设定该向量的初始值为: Dist[i]=Cost[i0,i] v i ∈ V。 令 S 为已经找到的从起点出发的最短路径的终点的集合。 2)选择 V j ,使得 Dist[j]=Min{ Dist[i]|V i ∈V-S } v i ∈ V v j 就是当前求得的一条从 v i0 出发的最短路径的终点,令 S=S∪ {v j } 3)修改从 v i0 出发到集合 V-S中任意一顶点 v k 的最短路径长度。如果 Dist[j]+Cost[j,k]<Dist[k] 则修改 Dist[k]为: Dist[k]=Dist[j]+Cost[j,k] 4)重 复第 2、 3 步操 作共 n-1 次, 由此 求得 从 v i0 出发 的到图 上各 个顶 点的 最短 路径是 依 路径长度递增的序列。表 8-1 是图 8-14 根据 Dijkstra计算的结果。 表 8-1:用 Dijkstra 计算的结果 终点 从 v 0 到其它各个节点的最短路径 v 1 ∞ ∞ ∞ ∞ ∞ 无 v 2 10 ( v 0 ,v 2 ) v 3 ∞ 60 50 (v 0 ,v 2 ,v 3 ) (v 0 ,v 4 ,v 3 ) v 4 30 ( v 0 ,v 4 ) 30 (v 0 ,v 4 ) v 5 100 ( v 0 ,v 5 ) 100 ( v 0 ,v 5 ) 90 ( v 0 ,v 4 ,v 5 ) 60 ( v 0 ,v 4 ,v 3 ,v 5 ) v j v 2 v 4 v 3 v 5 在实际应用中,采用 Dijkstra算法计算两点之间的最短路径和求从一点到其它所有点的 最短路径所需要的时间是一样的,算法时间复杂度为O(n 2 )。 6. 2. 3 资源分配 资源分配网络模型由中心点(分配中心或收集中心)及其属性和网络组成。分配有两种 形式,一种是由分配中心向四周分配,另一种是由四周向收集中心分配。资源分配的应用包 括消防站点分布和求援区划分、学校选址、垃圾收集站点分布,停水停电对区域的社会、经 济影响估计等。 1)负荷设计 负荷设计可用于估计排水系统在暴雨期间是否溢流,输电系统是否超载等。 2)时间和距离估算 时间和距离估算除用于交通时间和交通距离分析外,还可模拟水、电等资源或能量在网 络上的距离损耗。 网络分析的具体门类、对象、要求变化非常多,一般的 GIS 软件往往只能提供一些常 用的分析方法、或提供描述网络的数据模型和存储信息的数据库。其中最常用的方法是线性 阻抗法,即资源在网络上的运输与所受的阻力和距离(或时间)成线性正比关系,在这基础 上选择路径,估计负荷,分配资源,计算时间和距离等。对于特殊的、精度要求极高的、非 线性阻抗的网络,则需要特殊的算法分析。 7.空间插值 7. 1 空间插值的概念和理论 空间插值常用于将离散点的测量数据转换为连续的数据曲面, 以便与其它空间现象的分 布模式进行比较,它包括了空间内插和外推两种算法。空间内插算法是一种通过已知点的数 据推求同一区域其它未知点数据的计算方法;空间外推算法则是通过已知区域的数据,推求 其它区域数据的方法。在以下几种情况下必须作空间插值: 1)现有的离散曲面的分辨率,象元大小或方向与所要求的不符,需要重新插值。例如 将一个扫描影象(航空像片、遥感影象)从一种分辨率或方向转换到另一种分辨率或方向的 影象。 2)现有的连续曲面的数据模型与所需的数据模型不符,需要重新插值。如将一个连续 的曲面从一种空间切分方式变为另一种空间切分方式,从 TIN 到栅格、栅格到 TIN 或矢量 多边形到栅格。 3)现有的数据不能完全覆盖所要求的区域范围,需要插值。如将离散的采样点数据内 插为连续的数据表面。 空间插值的理论假设是空间位置上越靠近的点,越可能具有相似的特征值;而距离越远 的点,其特征值相似的可能性越小。然而,还有另外一种特殊的插值方法——分类,它不考 虑不同类别测量值之间的空间联系,只考虑分类意义上的平均值或中值,为同类地物赋属性 值。它主要用于地质、土壤、植被或土地利用的等值区域图或专题地图的处理,在“景观单 元”或图斑内部是均匀和同质的,通常被赋给一个均一的属性值,变化发生在边界上。 7. 2 空间插值的数据源 连续表面空间插值的数据源包括: g108g32摄影测量得到的正射航片或卫星影象; g108g32卫星或航天飞机的扫描影象; g108g32野外测量采样数据,采样点随机分布或有规律的线性分布(沿剖面线或沿等高线); g108g32数字化的多边形图、等值线图; 空间插值的数据通常是复杂空间变化有限的采样点的测量数据,这些已知的测量数据称 为“硬数据”。如果采样点数据比较少的情况下,可以根据已知的导致某种空间变化的自然 过程或现象的信息机理,辅助进行空间插值,这种已知的信息机理,称为“软信息”。但通 常情况下,由于不清楚这种自然过程机理,往往不得不对该问题的属性在空间的变化作一些 假设,例如假设采样点之间的数据变化是平滑变化,并假设服从某种分布概率和统计稳定性 关系。 采样点的空间位置对空间插值的结果影响很大,理想的情况是在研究区内均匀布点。然 而当区域景观大量存在有规律的空间分布模式时,如有规律间隔的数或沟渠,用完全规则的 采样网络则显然会得到片面的结果,正是这个原因,统计学家希望通过一些随机的采样来计 算无偏的均值和方差。但是完全随机的采样同样存在缺陷,首先随机的采样点的分布位置是 不相关的,而规则采样点的分布则只需要一个起点位置,方向和固定大小的间隔,尤其是在 复杂的山地和林地里比较容易。其次完全随机采样,会导致采样点的分布不均,一些点的数 据密集,另一些点的数据缺少。图 8-15 列出空间采样点分布的几种选择。 ( 1)规 则采 样 ( 2)随 机采 样 ( 4)成 层随 机采 样 ( 5)聚 集采 样 ( 3)断 面采 样 ( 6)等 值线 采样 图 8-15:各种不同的采样方式 规则采 样和 随机 采样 好的 结合方 法是 成层 随机 采样 , 即单个 的点 随机 的分 布于 规则的 格 网内 。 聚 集采 样可用 于分 析不同 尺度 的空 间变 化。 规则断 面采 样常 用于 河流 、 山 坡剖 面的 测 量。等值线采样是数字化等高线图插值数字高程模型最常用的方法。 术语: () i xz 是一 个数 据点 的属 性值, 其中 i x 是所 有测 量点 中的一 个。 () 0 xz g41 是一 个点 x 0 插值 后的 数值 。 如 果一 种 插值方 法计 算的 数据 , 其 中采样 点的 计算 数据 等于 已知的 采样 数 据, 称这 种插 值方法 是精 确插值 方法 ; 所有的 其它 插值方 法为 近似 插值 方法 。 统 计计 算值 和 测量值之间的差 异(绝对值和平方差 ) , () 0 xz g41 - () i xz , 是评价不精确插值方法 质量常用的 指标。 7. 3 空间插值方法 空间插 值方 法可 以分 为整 体插值 和局 部插 值方 法两 类。 整体 插值 方法 用研 究区 所有采 样 点的数据进行全区特征拟合;局部插值方法是仅仅用邻近的数据点来估计未知点的值。 整体插 值方 法通 常不 直接 用于空 间插 值, 而是 用来 检测不 同于 总趋 势的 最大 偏离部 分, 在去 除了宏 观地 物特 征后 , 可 用剩余 残差 来进 行局 部插 值。 由于 整体 插值方 法将 短尺度 的 、 局 部 的变化 看作 随机 的和 非结 构的噪 声, 从而 丢失 了这 一部分 信息 。 局 部插 值方 法恰好 能弥 补整 体插值方法的缺陷,可用于局部异常值,而且不受插值表面上其它点的内插值影响。 7. 3. 1 整体插值方法 1)边界内插方法 边界内 插方 法假 设任 何重 要的变 化发 生在 边界 上, 边界内 的变 化是 均匀 的, 同质的 , 即 在各方 向都 是相 同的 。 这 种概念 模型 经常 用于 土壤 和景观 制图 , 可 以通 过定 义 “ 均 质 的 ” 土 壤单元、景观图斑,来表达其它的土壤、景观特征属性。 边界内插方法最简单的统计模型是标准方差分析( ANOVAR)模型: () εαμ ++= k xz 0 式中, z是在 x 0 位置的属 性 值 , μ 是总 体平 均值, α k是 k类平 均值 与μ 的差 , ε 为 类 间 平 均 误 差(噪声) 。 该模型 假设 每一 类别 k的 属 性值是 正态 分布 ; 每 类 k的 平均值 (μ +α k) 由 一个 独立 样 品 集估计,并假设它们是与空间无关的;类间平均误差ε假设所有类间都是相同的。 评价分类效果的指标是 )( 22 tw δδ , 为类间方差, 为总体方差,比值越小分 类效果越好。分类效果的显著性检验可以用 F 检验。 2 w δ 2 t δ 实质上,边界内插方法的理论假设是: g108g32属性值 z 在“图斑”或景观单元内是随机变化的,不是有规律的; g108g32同一类别的所有“图斑”存在同样的类方差(噪声) ; g108g32所有的属性值都呈正态分布; g108g32所有的空间变化发生在边界上,是突变而不是渐变。 在使用边界内插时,应仔细考虑数据源是否符合这些理论假设。 2)趋势面分析 某种地 理属 性在 空间 的连 续变化 , 可 以用 一个 平滑 的数学 平面 加以 描述 。 思 路是先 用已 知采样 点数 据拟 合出 一个 平滑的 数学 平面 方程 ,再 根据该 方程 计算 无测 量值 的点上 的数 据 。 这种只 根据 采样 点的 属性 数据与 地理 坐标 的关 系 , 进 行多元 回归 分析 得到 平滑 数学平 面方 程 的方法 ,称 为趋 势面 分析 。它的 理论 假设 是地 理坐 标 ( x,y) 是独 立变 量, 属性 值 Z 也是 独 立变量且是正态分布的,同样回归误差也是与位置无关的独立变量。 多项式 回归 分析 是描 述长 距离渐 变特 征的 最简 单方 法。 多项 式回 归的 基本 思想 是用多 项 式表示 线 、 面 , 按 最 小 二 乘法原 理对 数据 点进 行拟 合。 线或 面多 项式的 选择 取决于 数据 是一 维的还是二维的。 用一个 简单 的示 例来 说明 ,地理 或环 境调 查中 特征 值 z沿一 个断 面在 x 1 , x 2 …x n 处采样, 若 z值随 x值增加而线性增大,则该特征值的长期变化可以用下面一个回归方程进行计算: () ε++= xbbxz 10 其中, b 0 , b 1 为回归系数,ε为独立于 x的正态分布残差(噪声) 。 然而许 多情 况下 , 不 是以 线性函 数, 而是 以更 为复 杂的方 式变 化, 则需 用二 次多项 式进 行拟合: () ε+++= 2 210 xbxbbxz 对于二维的情况, XY 坐标的多元回归分析得到的曲面多项式,形式如下: (){} () g229 ≤+ ??= psr sr rs yxbyxf , 前三种形式分别是: 0 b 平面 ybxbb 210 ++ 斜平面 2 54 2 3210 ybxybxbybxbb +++++ 二次曲面 其中, p 是趋势面方程的次数。 ()( )221 ++= ppP 是趋势 面多 项式 正常 情况 下的最 少项 数个 数。 零次 多 项式是 平面 , 有 1 个项 数; 一次 多项 式 是斜平 面, 有 3 个项 数;二 次 曲面有 6 个项 数, 三 次趋势 面 有 10 个项数。 计算系 数 b i 是一个 标准 的多 元回归 问题 。 趋 势面 分析 的优点 是非 常容 易理 解, 至少是 在 计算方 面。 另外 大多 数情 况下可 用低 次多 项式 进行 拟合, 但给 复杂 的多 项式 赋与明 确的 物理 意义比较困难。 趋势面 是个 平滑 函数 , 很 难正好 通过 原始 数据 点, 除非是 数据 点少 且趋 势面 次数高 才能 是曲面 正好 通过 原始 数据 点, 所 以 趋 势 面 分 析 是 一 个近似 插值 方法 。 实 际上 趋势面 最有 成效 的应用 是揭 示区 域中 不同 于总趋 势的 最大 偏离 部分 , 所 以 趋 势 面 分 析 的 主 要 用途是 , 在 使用 某种局 部插 值方 法之 前, 可用趋 势面 分析 从数 据中 去掉一 些宏 观特 征, 不直 接用它 进行 空间 插值。 趋势面 拟合 程度 的检 验, 同多元 回归 分析 一样 ,可 用 F 分布进 行检 验, 其检 验统计 量 为: ()1?? = pnQ pU F 其中, U为回 归平 方和 , Q为残差 平方 和 ( 剩余 平方 和) , p为多 项式 项数 ( 不 包括常 数项 b 0 ) , n为使用数据点数目。当 F>F a 时,趋势面显著,否则不显著。 3)变换函数插值 根据一个或多个 空间参量 的经验方程进行 整体空间 插值,也是经常 使用的空 间插值方 法,这种经验方程称为变换函数。下面以一个研究实例进行说明。 冲积平 原的 土壤 重金 属污 染与几 个重 要因 子有 关 , 其中距 污染 源 ( 河 流 ) 的 距 离 , 和 高 程两个 因子 最重 要。 一般 情况 , 携 带重 金属的 粗粒 泥沙沉 积在 河滩 上, 携带 重金属 的细 粒 泥 沙沉淀 在低 洼的 在洪 水期 容易被 淹没 的地 方, 而那 些洪水 频率 低的 地方 , 由 于携带 重金 属污 染泥沙 颗粒 比较 少, 受到 污染轻 。 由 于 距河流 的距 离和高 程是 比较 容易 得到 的空间 变量 , 可 以用各 种重 金属 含量 与它 们的经 验方 程进 行空 间插 值, 以 改 进 对 重 金 属 污 染 的预测 。 本 例回 归方程的形式如下: () ε+++= 22110 pbpbbxz 式中是 z(x)某种重金 属含 量( ppm) , b 0 …b n 是回归系数, p 1 …p n 是独立空间变量,本例 p 1 是 距河流的距离因子, p 2 是高程因子。 这种回 归模 型通 常叫 做转 换函数 ,大 多数 GIS 软件 都可以 计算 。转 换函 数可 以应用 于 其他独 立变 量, 如温 度、 高程、 降雨 量和 距海 、 植 被的距 离关 系可 以组 合为 一个超 剩含 水量 的函数 。 地理 位置 及其 属性 可以尽 可能 多的 信息 组合 成需要 的回 归模 型 , 然 后 进 行空间 插值 。 但应该 注意 的一 点是 , 必 须清楚 回归 模型 的物 理意 义。 还 要 指 出 的 是 所 有 的 回归转 换函 数都 属于近似的空间插值。 整体插 值方 法通 常使 用方 差分析 和回 归方 程等 标准 的统计 方法 , 计 算比 较简 单。 其 它 的 许多方 法也可 用于整 体空 间插值 ,如傅 立叶级 数和 小波变 换,特 别是遥 感影 象分析 方面 , 但它们需要的数据量大。 7. 3. 2 局部插值方法 局部插值方法只使用邻近的数据点来估计未知点的值,包括几个步骤: 1)定义一个邻域或搜索范围; 2)搜索落在此邻域范围的数据点; 3)选择表达这有限个点的空间变化的数学函数; 4) 为 落 在 规 则 格 网 单 元 上 的数据 点赋 值。 重复 这个 步骤直 到格 网上 的所 有点 赋值完 毕 。 使用局 部插 值方 法需 要注 意的几 个方 面是 : 所 使用 的插值 函数 ; 邻 域的 大小、 形状和 方 向;数据点的个数;数据点的分布方式是规则的还是不规则的。 1)最近邻点法:泰森多边形方法 泰森多 边形 ( Thiessen,又 叫 Dirichlet 或 Voronoi 多边 形)采 用了 一种 极端 的边 界 内 插 方法 , 只 用最 近的单 个点 进行区 域插 值 。 泰森 多边 形按数 据点 位置 将区 域分 割成子 区域 , 每 个子区 域包 含一 个数 据点 , 各 子 区 域 到 其 内 数 据 点 的距离 小于 任何 到其 它数 据点的 距离 , 并 用其内 数据 点进 行赋 值 。 连 接所有 数据 点的 连线 形 成 Delaunay 三角形 , 与不 规 则三角 网 TIN 具有相同的拓扑结构。 GIS 和地 理分 析中 经常 采 用泰森 多边 形进 行快 速的 赋值 , 实际 上泰 森多 边形 的一 个 隐 含 的假设 是任 何地 点的 气象 数据均 使用 距它 最近 的气 象站的 数据 。 而 实际 上, 除 非是有 足够 多 的气象 站, 否则 这个 假设 是不恰 当的 , 因 为降 水、 气压、 温度 等现 象是 连续 变化的 , 用 泰森 多边形插值方法得到的结果图变化只发生在边界上,在边界内都是均质的和无变化的。 2)移动平均插值方法:距离倒数插值 距离倒 数插 值方 法综 合了 泰森多 边形 的邻 近点 方法 和趋势 面分 析的 渐变 方法 的长处 , 它 假设未 知点 x 0 处属性 值是 在局部 邻域 内中 所有 数据 点的距 离加 权平 均值 。 距 离倒数 插值 方法 是加权移动平均方法的一种。加权移动平均方法的计算公式如下: () () g229 = ?= n i ii xzxz 1 0 ? λ 1 1 = g229 = n i i λ 式中 , 权 重系 数由 函数 计算 , 要 求当 时 , 一 般 取 倒 数或负 指数 形式 。其中 最常见的形式是距离倒数加权函数,形式如下: () i xxd ,φ ) 0→d () 1→dφ 2 ,, ddr eed ??? ( i xxd ,φ () () g229g229 = ?? = ?= n i r ij r ij n i ij ddxzxz 11 ? 式中, x j 为未知点, x i 为已知数据点。 加权移动平均公式最简单的形式称为线性插值,公式如下: () () g229 = = n i i xz n xz 1 0 1 ? 距离倒 数插 值方 法是 GIS 软件根 据点 数据 生成 栅格 图层的 最常 见方 法。 距离 倒数法 计 算值易 受数 据点 集群 的影 响, 计 算 结 果 经 常 出 现 一 种孤立 点数 据明 显高 于周 围数据 点的 “鸭 蛋”分布模式,可以在插值过程中通过动态修改搜索准则进行一定程度的改进。 3)样条函数插值方法 在计算 机用 于曲 线与 数据 点拟合 以前 , 绘图 员是 使用 一种灵 活的 曲线 规逐 段的 拟合出 平 滑 的 曲线。 这 种 灵 活 的 曲 线 规绘出 的分 段曲 线称 为样 条。 与样 条匹 配的 那些 数据 点称为 桩点 , 绘制曲 线时 桩点 控制 曲线 的位置 。 曲线 规绘 出的 曲线 在数学 上用 分段 的三 次多 项式函 数来 描 述这种曲线,其连接处有连续的一阶和二阶连续导数。 样条函 数是 数学 上与 灵活 曲线规 对等 的一 个数 学等 式, 是 一 个 分 段 函数, 进行 一次拟 合 只有与 少数 点拟 合, 同时 保证曲 线段 连接 处连 续。 这就意 味着 样条 函数 可以 修改少 数数 据点 配准而不必重新计算整条曲线,趋势面分析方法做不到这一点, (图 16) 。 (a) (b) 图 8-16:样条函数的局部特征 ( a:当二次样条曲线的一个点位置变化时,只需要重新计算四段曲线; b:而一次样条曲线的一个点位置变化时,只需要重新计算两段曲线) 一般的分段多项式 p(x)定义为: p(x)=p i (x) x i < x < x i+1 ( i=1, 2, 3…, k-1 ) () () i j ii j i xpxp )( 1 )( + = ( j=0, 1, 2, ..., r-1; i=1, 2, ... , k-1 ) x 1 , ..., x k-1 将区间 x 0 , x k 分成 k个子 区间, 这些 分割 点称 “断点 ” , 曲 线上 具有 这些 x值的 点称 为 “节” 。函数 p i (x)为小于等于 m次的多项式。 r项用来表示样条函数的约束条件: r=0,无约束; r=1,函数连续且对它的导数无任何约束; r=m-1,区间 [x 0 x k ]可用一个多项式表示; r=m,约束条件最多。 m=1,2,3 时的 样条 分别 为一次 、二次 、三次 样条 函数,其 导数 分别 是 0 阶、 1 阶、 2 阶导 数, 二次样 条函 数的 每个 节点 处必须 有一 阶连 续导 数 , 三 次样条 函数 的每 个节 点初 必须有 二阶 连 续导数 。 r=m 的简 单样 条只 有 k+m 个自 由度 , r=m=3 有着 特殊 的意 义, 因为 它是三 次多 项 式, 该 函 数 首 次 被 人 们 称 为样条 函数 。 术 语 “ 三 次 样 条 ” 用 于三 维情 况, 此 时 进 行曲面 内插 , 而不是曲线内插。 由于离 散子 区间 的范 围较 宽, 可 能 是 一 条 数 字 化 的 曲线, 在这 个范 围内 计算 简单样 条会 引起一 定的 数学 问题 , 因 此在实 际应 用中 都 用 B 样 条—一 种特 殊的 样条 函数 。 B 样条 是感 兴 趣区间以外均为零的其它样条的和,因此可按简单的方法用低次多项式进行局部拟合。 B 样 条 经 常 用 于 数 字 化 的 线划在 显示 之前 进行 平滑 处理, 例如 土壤、 地质 图上 的各种 边 界,传 统的 制图 总希 望绘 出较平 滑的 曲线 。但 是用 B 样条 做多 边形 边界 平滑 也存在 一些 问 题,特别是多边形面积和周长的计算,结果会与平滑前的不同。 综 上 所述, 样条 函数 是分段 函 数 , 每 次只 用少 量数据 点, 故插 值速 度快。 样条 函 数 与 趋 势面分 析和 移动 平均 方法 相比, 它保 留了 局部 的变 化特征 。 线 性和 曲面 样条 函数都 在视 觉上 上得到 了令 人满 意的 结果 。 样 条函 数的 一些缺 点是 : 样 条内 插的 误差不 能直 接估算 , 同 时 在 实践中 要解 决的 问题 是样 条块的 定义 以及 如何 在三 维空间 中将 这些 “块 ” 拼 成复杂 曲面 , 又 不引入原始曲面中所没有的异常现象等问题。 4)空间自协方差最佳插值方法:克里金插值 前面介 绍的 几个 插值 方法 对影响 插值 效果 的一 些敏 感性问 题仍 没有 得到 很好 的解决 , 例 如趋势面分析的控制参数和距离倒数插值方法的权重对结果影响很大,这些问题包括: g108g32需要计算平均值数据点的数目; g108g32搜索数据点的邻域大小、方向和形状如何确定; g108g32有没有比计算简单距离函数更好的估计权重系数的方法; g108g32与插值有关的误差问题。 为解决 这些 问题 , 法 国 地 理数学 学 家 Georges Matheron 和南 非矿 山工 程 师 D.G.Krige 研 究了一 种优 化插 值方 法, 用于矿 山勘 探 。 这个 方法 被广泛 地应 用于 地下 水模 拟、 土壤 制图 等 领域, 成为 GIS 软件 地理 统计插 值的 重要 组成 部分 。 这 种 方 法 充 分 吸收了 地 理统计 的思 想, 认为任 何在 空间 连续 性变 化的属 性是 非常 不规 则的 ,不能 用简 单的 平滑 数学 函数进 行模 拟 , 可以用 随机表 面给予 较恰 当的描 述。这 种连续 性变 化的空 间属性 称为“ 区域 性变量” ,可 以 描述象 气压 、 高 程及 其它 连续性 变化 的描 述指 标变 量。 这 种 应 用 地 理 统 计 方 法进行 空间 插值 的方法 ,被 称为 克里 金( Kriging)插值 。 地 理 统 计 方法为 空间 插值 提供 了一 种优化 策略 , 即在插 值过 程中 根据 某种 优化准 则函 数动 态的 决定 变量的 数值 。 Matheron , Krige 等人研 究 的插值 方法 着重 于权 重系 数的确 定, 从而 使内 插函 数处于 最佳 状态 , 即 对给 定点上 的变 量值 提供最好的线性无偏估计。 克里金插值方法 的区域性 变量理论假设任 何变量的 空间变化都可以 表示为下 述三个主 要成分的和(图 8-17) : 1)与恒定均值或趋势有关的结构性成分; 2)与空间变化有关的随机变量,即区域性变量; 3)与空间无关的随机噪声项或剩余误差项。 图 8-17:区域变量理论将复杂的空间变化分为三个部分 (i)地形的平均特性; (ii)空间相关的不规则变化; (iii)随机的、局部的变化 另 x 为一维、二维或三维空间中的某一个位置,变量 z 在 x 处的值可又下式计算: ''' )()()( εε ++= xxmxz 式中 , m(x)是描述 z(x)的结 构性成 分的 确定 性函 数 ; 是与空 间变 化有 关的 随机 变化项 , 即区域 性变 量 ; 是剩 余误 差项 , 空 间上 具有 零平 均 值 、 与空 间无 关的 高斯 噪 声项。 )( ' xε ()x '' ε 2 σ 克里金方法 的第一步 是确 定适当的 m(x)函数, 最简 单的情况是 m(x)等于 采样 区的平均 值,距离矢量 h分离的两点 x, x+h之间的数学期望等于零: () ( )[]0=+? hxzxzE 式中 z(x), z(x+h) 是随 机变量 z 在 x, x+h 处的 值, 同 时还假 设两 点之 间的 方差 只与距 离 h 有 关,于是: ()[]()[ ] ()hhxxEhxzxzE γεε 2)()()()( 2 '' 2 =+?=+? 式中, 是一种函数,称为半方差函数。 ()hγ 区域性变量理论 的两个内 在假设条件是差 异的稳定 性和可变性,一 旦结构性 成分确定 后, 剩 余 的 差 异 变 化 属 于 同质变 化, 不同 位置 之间 的差异 仅是 距离 的函 数。 这样, 区域 性变 量计算公式可以写成下式的形式: () () () '' εγ ++= hxmxz 半方差的估算公式如下: () () ( )[] 2 1 2 1 ? g229 = +?= n i ii hxzxz n hγ 式中 , n 为距 离为 h 的采 样 点对的 数目 ( n 对点 ) , 采 样间 隔 h 也叫 延迟 。 对 应于 h 的 的 图被称为“半方差图” 。图 8-18 表示一个典型的半方差图。 ()hγ? 半方差 是定 量描 述区 域性 变化的 第一 步, 它为 空间 插值、 优化 采样 方案 提供 了有益 的信 息。为了求得半方差图,必须先得到拟合半方差的理论模型,在半方差理论模型中: 1)延 迟 h 的 值 较 大 的 部 分 曲线呈 水平 方向 。 曲 线 的 水平部 分成 为 “ 梁 ( Sill) ” 。说 明 在 延迟的这个范围内数据点没有空间相关性,因为所有的方差不随距离增减而变化。 2)曲线从 的低值升到梁为止的延迟范围,称为“变程( Range) ” 。变程是半方 差 图最重 要的 部分 , 因 为它 描述了 与空 间有 关的 差异 怎样随 距离 变化 的。 在变 程范围 内距 离越 近的点 具有 更相 近的 特征 。 变 程 给 移 动 加 权 平 均 方 法提供 了一 个确 定窗 口大 小的方 法。 很显 然, 数据 点和 未知点 之间 的距离 大于 变程 范围 , 表 明该数 据点 与未 知点 距离 太远 , 对 插值 没 有作用。 ()hγ 3)图中的拟合模型没有通过原点,而是在 的正方向与坐标轴相截。 ()hγ C1 C0 变程 梁 核方差 h ()hγ 图 8-18:半方差图 按半方 差计 算公 式 , 当 h=0 时, 必须为 零。 模型 中出 现的正 值 是剩余 误差 的估计值, 它是与 空 间无关的 噪声。 称为“ 核 (Nugget)”方差, 是观测 误 差的和 距离间隔很小的情况下的空间变化的组合。 ()hλ ? ()hγ 0→h '' ε '' ε 当存在 明显 的变 程和 梁, 同时核 方差 也很 重要 但数 值不太 大的 情况 下, 可用 球面模 型进 行半方差拟合(图 8-19-1) 。公式是: () () g250 g251 g249 g234 g235 g233 ?+= 2 2 3 3 10 ah a h cchγ 0 < h < a () 10 cch +=γ h >= a () 00 =γ h=0 式中, a是变程, h是延迟, c 0 +c 1 为梁。一般情况下用球面模型拟合效果比较理想。 如果存 在明 显的 核方 差和 梁, 而没 有渐 变的 变程 , 则可用 指数 模型 ( 图 8-19-2)进 行 拟 合: () ()[]ahcch ??+= exp1 10 γ 如果核 方差 相对 于与 空间 变化有 关的 随机 变化 很 小 的 情 况下, 最好 使用 比较弯 曲 的曲线,如高斯曲线: (图 8-19-4) ()x '' ε () ()[ ] 2 10 exp1 ahcch ??+=γ 如果空间变化随变程渐变,但没有梁,则可用线性模型(图 8-19-3)进行拟合: () bhch += 0 γ 式中, b 为线的斜率。当变程的大小远超过人们希望的插值范围时,也用线性模型。 前 面的讨 论都假 设地表 特征 在各个 方向都 是相同 的, 然而许 多情况 下空间 变化 中的 都具有明显的方向性,这是就要用不同参数的模型来拟合半方差图。 )( ' xε C1 C0 变程 梁 核方 差 h ()hγ C1 C0 变程 梁 核方 差 h ()hγ C1 C0 核方 差 h ()hγ C1 C0 变程 梁 核方 差 h ()hγ 1) 2) 3) 4) 图 8-19:各种不同的变方差图 拟合后的 半方 差图重 要的 用途是确 定局 部内插 需要 的权重因 子 。确定 的过程 与加 权移 动插值方 法类似, 但不是 按一种固 定的函数 计算 , 而是按采 样点数据 的半方 差图的 统计分析原理计算。即: i λ i λ i λ 1 1 = g229 = n i i λ () () g229 = ?= n i ii xzxz 1 0 ? λ 权重 的选择 应使 是无 偏估 计,且 估计 的方 差 小于观 测值的 其它 线性 组合 产 生的方差。 i λ ( 0 ? xz ) ) ) ) 2 e σ ( 0 ? xz 的最小方差为: ()Φ+= g229 = n i iie xx 1 0 2 ,? γλσ 只有下式成立时,才可获得 的最小方差: ( 0 ? xz () ( 0 1 ,, xxxx j n i jii γγλ =Φ+ g229 = 式中 , ( ) ji xx ,γ 是 z在采 样点 x i , x j 之间的半 方差 ; ( ) 0 , xx j γ 是采 样点 x j 和 未知点 x 0 之间的 半方 差,这两 个量均可 从已拟 合模型的 半方差图 上得到 。量 计算 最小方差 需要的 拉格朗 日算子。 Φ 这个方 法叫 常规 克里 金插 值。 它是 一个 精确 插值 模 型 , 内 插 值 或 最 佳 局 部 均 值与数 据点 上的值 一致 。 制 图中 常用 比采样 间隔 更细 的规 则格 网进行 插值 , 内 插值 又可 用前边 提到 的方 法转换 成等 值线图 。与 此 类似, 估计 的误差 ,又 叫 克里金 方差 ,可以 用来 制 图以反 映在 整个研究区内插值结果的可靠性。 2 e σ 一个克里金插值的示例: (图 8-20) 图 8-20:克里金插值的示例 计算图 中 (x=5,y = 5 )处未 知点 I0 的克 里金 方法 的权 重,使 用球 面模 型对 半方 差进行 拟 和,参数 c 0 = 2.5 , c 1 =7.5;变程 a= 10.0。这 5 个采样点的数据分别是: I x y z I1 2 2 3 I2 3 7 4 I3 9 9 2 I4 6 5 4 I5 5 3 6 解法过程用矩阵的表示如下: g250 g251 g249 g234 g235 g233 Φ = λ b 1- A 其中, A 为数 据点 之间 的 半方差 矩阵 , b 是每 个数 据 点与未 知点 之间 的半 方差 向量, λ 为要 计算的权重系数向量, Φ 为解方程的拉格郎日算子。 首先计算这 5 个数据点之间的距离矩阵: I 1 2 3 4 5 I1 0.0 5.099 9.899 5.000 3.162 I2 5.099 0.0 6.325 3.606 4.472 I3 9.899 6.325 0.0 5.0 7.211 I4 5.0 3.606 5.0 0.0 2.236 I5 3.162 4.472 7.211 2.236 0.0 和它们与未知点之间的距离向量: I I0 I1 4.243 I2 2.808 I3 5.657 I4 1.0 I5 2.0 将上述数值带入球面模型,得到相应的半方差(矩阵A, b): A= I 1 2 3 4 5 6 1 2.500 7.739 9.999 7.656 5.939 1.000 2 7.739 2.500 8.677 6.381 7.196 1.000 3 9.999 8.677 2.500 7.656 9.206 1.000 4 7.656 6.381 7.656 2.500 4.936 1.000 5 5.939 7.196 9.206 4.936 2.500 1.000 6 1.000 1.000 1.000 1.000 1.000 0.000 b = I 0 1 7.151 2 5.597 3 8.815 4 3.621 5 4.720 6 1.000 注意额外的第 6 行和第 6 列,是为了保证权重之和为 1。 计算 A 的逆矩阵,得: A -1 = I 1 2 3 4 5 6 1 -0.172 0.050 0.022 -0.026 0.126 0.273 2 0.050 -0.167 0.032 0.077 0.007 0.207 3 0.022 0.032 -0.111 0.066 -0.010 0.357 4 -0.026 0.077 0.066 -0.307 0.190 0.030 5 0.126 0.007 -0.010 0.190 -0.313 0.134 6 0.273 0.207 0.357 0.003 0.134 -6.873 于是,权重 λ 为: I 权重系数 距离 1 0.0175 4.423 2 0.2281 2.828 3 -0.0891 ∑ = 1 5.657 4 0.6437 1.000 5 0.1998 2.000 6 0.1182 φ 得未知点插值后得数值为: z(I0) =0.0175*3 + 0.2281*4 - 0.0891*2 + 0.6437*4 + 0.1998*6 = 4.566 估计方差为: σ e 2 = [0.0175* 7.151+ 0.2281* 5.597 - 0.0891* 8.815 + 0.6437 *3.621 + .1998 *4.720 ] +φ = 3.890 + 0.1182 = 4.008 克里金 插值 方法 的目 的是 提供确 定权 重系 数最 优的 方法和 并能 描述 误差 信息 。 由 于克 里 金点模 型 ( 常规 克里 金模 型) 的 内 插 值 与 原 始 样 本 的容量 有关 , 当 样本 少的 情况下 , 采 用简 单的点 常规 克里 金插 值的 内插结 果图 会出 现明 显的 凹凸现 象 。 可以 通过 修改 克里 金 方 程 以 估 计子块 B 内 的 平 均 值 来 克 服这一 缺点 。该 方法 叫块 克里金 插值 ,该 方法 对估 算给定 面积 试 验小区的平均值或对给定格网大小的规则格网进行插值比较适用。 子块 B 内 z 的均值为: () () g242 = B B S dxxz Bz 式中, S B 为子块 B的面积。 z(x)仍用相同的估计公式: () () g229 = ?= n i ii xzxz 1 0 ? λ 1 1 = g229 = n i i λ 最小方差仍为: ()Φ+= g229 = n i iie xx 1 0 2 ,? γλσ 但成立条件则变为: () ()Bxxx j n i jii ,, 1 γγλ =Φ+ g229 = 块克里 金插 值估 算的 方差 结果常 常小 于点 克里 金插 值, 所以 生成 的平 滑插 值 表面不 会发 生点模型的凹凸现象。 8.空间统计分类分析 多变量 统计 分析 主要 用于 数据分 类和 综合 评价 。 数据 分类方 法是 地理 信息 系统 重要的 组 成部分 。 一 般 说地理 信息 系统存 储的 数据 具有 原始 性质 , 用 户可 以根据 不同 的实用 目的 , 进 行提取 和分 析 , 特别 是对 于观测 和取 样数 据, 随着 采用分 类和 内插 方法 的不 同, 得到 的结 果 有很大的差异。因此,在大多数情况下,首先是将大量未经分类的数据输入信息系统数据库, 然后要求用户建立具体的分类算法,以获得所需要的信息。 综合评价模型是区划和规划的基础。从人类认识的角度来看有精确的和模糊的两种类 型,因为绝大多数地理现象难以用精确的定量关系划分和表示,因此模糊的模型更为实用, 结果也往往更接近实际。综合评价一般经过四个过程: 1)评价因子的选择与简化; 2)多因子重要性指标(权重)的确定; 3)因子内各类别对评价目标的隶属度确定; 4)选用某种方法进行多因子综合。 分类和评价的问题通常涉及大量的相互关联的地理因素, 主成分分析方法可以从统计意 义上将各影响要素的信息压缩到若干合成因子上,从而使模型大大地简化;因子权重的确定 是建立评价模型的重要步骤,权重正确与否极大地影响评价模型的正确性,而通常的因子权 重确定依赖较多的主观判断,层次分析法是综合众人意见,科学地确定各影响因子权重的简 单而有效的数学手段。隶属度反映因子内各类别对评价目标的不同影响,依据不同因子的变 化情况确定,常采用分段线性函数或其它高次函数形式计算。常用的分类和综合的方法包括 聚类分析和判别分析两大类。聚类分析可根据地理实体之间影响要素的相似程度,采用某种 与权重和隶属度有关的距离指标,将评价区域划分若干类别;判别分析类似于遥感图像处理 的分类方法,即根据各要素的权重和隶属度,采用一定的评价标准将各地理实体判归最可能 的评价等级或以某个数据值所示的等级序列上;分类定级是评价的最后一步,将聚类的结果 根据实际情况进行合并,并确定合并后每一类的评价等级,对于判别分析的结果序列采用等 间距或不等间距的标准划分为最后的评价等级。 下面简要介绍分类评价中常用的几种数学方法。 8. 1 主成分分析(Principal Component Analysis , PCA) 地理问题往往涉及大量相互关联的自然和社会要素, 众多的要素常常给模型的构造带来 很大困难,同时也增加了运算的复杂性。 为使用户易于理解和解决现有存储容量不足的问题, 有必要减少某些数据而保留最必要的信息。由于地理变量中许多变量通常都是相互关联的, 就有可能按这些关联关系进行数学处理达到简化数据的目的。 主成分分析是通过数理统计分 析,求得各要素间线性关系的实质上有意义的表达式,将众多要素的信息压缩表达为若干具 有代表性的合成变量,这就克服了变量选择时的冗余和相关,然后选择信息最丰富的少数因 子进行各种聚类分析,构造应用模型。 设有 n个样本,户个变量。将原始数据转换成一组新的特征值——主成分,主成分是原 变量的线性组合且具有正交特征。即将x 1 , x 2 , …, x p 综合成 m( m< p) 个指标z 1 , z 2 , …, z m , 即: z 1 =l 11 *x 1 +l 12 *x 2 +…+l 1p *x p z 2 =l 21 *x 1 +l 22 *x 2 +…+l 2p *x p … … z m =l m1 *x 1 +l m2 *x 2 +…+l mp *x p 这样决定的综合指标z 1 , z 2 , …, z m 分别称做原指标的第一,第二,…,第 m主成分。 其中z 1 在总方差中占的比例最大,其余主成分z 2 , z 3 , …, z m 的方差依次递减。在实际工作中 常挑选前几个方差比例最大的主成分,这样既减少了指标的数目,又抓住了主要矛盾,简化 了指标之间的关系。 从几何上看,确定主成分的问题,就是找p 维空间中椭球体的主轴问题,就是得到即将 x 1 , x 2 , …, x p 的相关矩阵中m 个较大特征值所对应的特征向量,通常用雅可比( Jacobi)法 计算特征值和特征向量。 很显然,主成分分析这一数据分析技术是把数据减少到易于管理的程度,也是将复杂数 据变成简单类别便于存储和管理的有力工具。 8. 2 层次分析法 层次分析( Analytic Hierarchy Process,AHP)法是系统分析的数学工具之一,它把人的 思维过程层次化、数量化,并用数学方法为分析、决策、预报或控制提供定量的依据。事实 上这是一种定性和定量分析相结合的方法。在模型涉及大量相互关联、相互制约的复杂因素 的情况下,各因素对问题的分析有着不同的重要性,决定它们对目标重要性的序列,对建立 模型十分重要。 AHP 方法把相互关联的要素按隶属关系分为若干层次,请有经验的专家对各层次各因 素的相对重要性给出定量指标,利用数学方法综合专家意见给出各层次各要素的相对重要性 权值,作为综合分析的基础。 8. 3 系统聚类分析 系统聚类是根据多种地学要素对地理实体进行划分类别的方法,对不同的要素划分类别 往往反映不同目标的等级序列,如土地分等定级、水土流失强度分级等。 系统聚类的步骤一般是根据实体间的相似程度,逐步合并若干类别,其相似程度由距离 或者相似系数定义。进行类别合并的准则是使得类间差异最大,而类内差异最小。 8. 4 判别分析 判别分析与聚类分析同属分类问题,所不同的是,判别分析是预先根据理论与实践确定 等级序列的因子标准,再将待分析的地理实体安排到序列的合理位置上的方法,对于诸如水 土流失评价、土地适宜性评价等有一定理论根据的分类系统定级问题比较适用。 判别分析依其判别类型的多少与方法的不同,可分为两类判别、 多类判别和逐步判别等。 通常在两类判别分析中,要求根据已知的地理特征值进行线性组合,构成一个线性判别 函数 Y,即: Y= c 1 *x 1 +c 2 *x 2 +…+c m *x p 式中, c k ( k= 1, 2, …, m) 为判别系数,它可反映各要素或特征值作用方向、分辨能力和 贡献率的大小。只要确定了 c k ,判别函数Y 也就确定了。在确定判别函数后,根据每个样本 计算判别函数数值,可以将其归并到相应的类别中。常用的判别分析有距离判别法、 Bayes 最小风险判别、费歇准则判别等等。 《地理信息系统 --原理、方法和应用》 邬伦等 南北美 洲三 角的 西端 , 都 有 北南走 向的 山脉 。 山 脉 面 积 大约占 总面 积的 三分 之一 , 其余的 三分 之二 在东 部, 是一块 大平 原。 平原 被两 座低矮 的山 脉把 它与 大海 隔离 开来。 在北 美洲, 是拉 布拉 多山和 阿巴 拉契 亚山 ; 南 美洲则 是圭 亚那 山脉 和巴 西 高原。 房龙 横看成岭侧成峰,远近高低各不同。 苏轼 第九章 数字地形模型( DTM)与地形分析 导读:DEM和DTM主要用于描述地面起伏状况,可以用于提取各种地形参数,如 坡度、坡向、粗糙度等,并进行通视分析、流域结构生成等应用分析。因此,DEM 在各个领域中被广泛使用。 DEM可以有多种表达方法,包括网格、等高线、三角网等,本章同时介绍了这些表 达方法之间的相互转换算法,如由三角网生成等高线,网格DEM生成三角网等等。 1.概述 数字地 形模 型( DTM, Digital Terrain Model)最 初是 为了高 速公 路的 自动 设计 提出来 的 ( Miller, 1956) 。 此后, 它被用 于各 种线 路选 线 ( 铁路、 公路、 输电 线) 的 设计以 及各 种工 程的面 积、 体积 、 坡 度计 算, 任 意 两 点 间 的 通 视 判 断及任 意断 面图 绘制 。 在 测绘中 被用 于绘 制等高 线、 坡度 坡向 图、 立体透 视图 , 制 作正 射影 像图以 及地 图的 修测 。 在 遥感应 用中 可作 为分类 的辅 助数 据。 它还 是地理 信息 系统 的基 础数 据, 可用 于土 地利用 现状 的分析 、 合 理 规 划及洪 水险 情预 报等 。 在 军事上 可用 于导 航及 导弹 制导、 作战 电子 沙盘 等。 对 DTM 的研 究 包括 DTM 的 精 度 问 题 、 地形分 类、 数据 采集 、 DTM 的粗差 探测 、质 量控 制 、数据 压缩 、 DTM 应用以及不规则三角网 DTM 的建立与应用等。 1.1 DTM 和 DEM 从数学 的角 度, 高程 模型 是高程 Z 关于 平面 坐 标 X, Y 两个 自变 量的 连续 函 数,数 字 高 程模型( DEM)只 是它的 一个有限 的离散 表示。高 程模型最 常见的 表达是相 对于海平 面 的海拔 高度 , 或某个 参考 平面的 相对 高度 , 所 以高 程模型 又叫 地形 模型 。 实 际上地 形模 型 不 仅包含高程属性,还包含其它的地表形态属性,如坡度、坡向等。 数字地 形模 型是 地形 表面 形态属 性信 息的 数字 表达 , 是带有 空间 位置 特征 和地 形属性 特 征 的 数 字 描 述 。 数 字 地形模 型中 地形 属性 为高程 时称 为数 字高 程模 型( Digital Elevation Model,简称 DEM) 。 高 程 是地理 空间 中的 第三 维坐 标。 由 于 传 统 的 地 理 信 息 系统的 数据 结 构都是 二维 的, 数字 高程 模型的 建立 是一 个必 要的 补充。 DEM 通常 用地 表规 则网格 单元 构 成的高 程矩 阵表 示, 广义 的 DEM 还包 括等 高线 、 三角网 等所 有表 达地 面高 程的数 字表 示。 在地理 信息 系统 中, DEM 是建 立 DTM 的基 础数 据, 其它的 地形 要素 可 由 DEM 直接 或间 接 导出,称为“派生数据” ,如坡度、坡向。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 1.2 DEM 的表示法 一个地 区的 地表 高程 的变 化可以 采用 多种 方法 表达 , 用 数 学 定 义 的 表 面 或点、 线、 影 像 都可用来表示 DEM,如图 9-1 所示。 1)数学方法 用数学 方法 来表 达, 可以 采用整 体拟 合方 法, 即根 据区域 所有 的高 程点 数据 , 用 傅 立 叶 级数和 高次 多项 式拟 合统 一的地 面高 程曲 面。 也可 用局部 拟合 方法 , 将 地表 复杂表 面分 成正 方形规 则区 域或 面积 大致 相等的 不规 则区 域进 行分 块搜索 , 根据 有限 个点 进行 拟合形 成高 程 曲面。 2)图形方法 ( 2. 1)线模式 等高线 是表 示地 形最 常见 的形式 。其 它的 地形 特征 线也是 表达 地面 高程 的重 要信息 源 , 如山脊线、谷底线、海岸线及坡度变换线等。 ( 2. 2)点模式 用离散 采样 数据 点建 立 DEM 是 DEM 建立 常用 的方 法之一 。数 据采 样可 以按 规则格 网 采样, 可以 是密 度一 致的 或不一 致的 ; 可 以是 不规 则采样 , 如 不规 则三 角网、 邻近网 模型 等; 也可以有选择性地采样,采集山峰、洼坑、隘口、边界等重要特征点。 DEM 表示 方法 数学方 法 图形法 整体 局部 傅立叶 级数 高次多 项式 规则数 学分 块 不规则 数学 分块 点数据 线数据 规 则 不规则 水平线 典型线 典型特 征 密度一 致 密度不 一致 三角网 邻近网 山峰、 洼坑 隘口、 边界 垂直线 山脊线 谷底线 海岸线 坡度变 换线 图 9-1: DEM 的表示方法 在地理 信息 系统 中, DEM 最主要 的三 种表 示模 型是 :规则 格网 模型 ,等 高线 模型和 不 规则三角网模型。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 2. DEM 的主要表示模型 2. 1 规则格网模型 规 则 网格, 通常 是正 方形, 也可 以是 矩形、 三角 形等 规 则 网 格 。 规 则网 格将区 域 空 间 切 分为规 则的 格网 单元 , 每 个格网 单元 对应 一个 数值 。 数 学上 可以 表示为 一个 矩阵 , 在 计算 机 实现中 则是 一个 二维 数组 。 每 个格 网单 元或 数组 的 一个元 素 , 对 应 一 个 高 程 值 , 如 图 9-2 所 示。 图 9-2:格网 DEM 对于每 个格 网的 数值 有两 种不同 的解 释。 第一 种是 格网栅 格观 点, 认为 该格 网单元 的数 值是其 中所 有点 的高 程值 , 即 格 网 单 元 对 应 的 地 面 面积内 高程 是均 一的 高度 , 这 种 数 字 高 程 模型是 一个 不连 续的 函数 。 第 二 种 是 点 栅 格 观 点 , 认 为该网 格单 元的 数值 是网 格中心 点的 高 程或该 网格 单元 的平 均高 程值, 这样 就需 要用 一种 插值方 法来 计算 每个 点的 高程。 计算 任何 不是网 格中 心的 数据 点的 高程值 , 使 用周 围 4 个中 心点的 高程 值, 采用 距离 加权平 均方 法进 行计算,当然也可使用样条函数和克里金插值方法。 规则格 网的 高程 矩阵 , 可 以很容 易地 用计 算机 进行 处理, 特别 是栅 格数 据结 构的地 理信 息系统 。 它 还可 以很 容易 地计算 等高 线、 坡度 坡向 、 山 坡 阴 影 和 自 动 提 取 流 域地形 , 使 得它 成为 DEM 最广 泛使 用的 格式, 目前 许多 国家 提供 的 DEM 数据 都是 以规 则格 网 的 数 据 矩 阵 形式提 供的 。 格 网 DEM 的 缺点是 不能 准确 表示 地形 的结构 和细 部, 为避 免这 些问题 , 可 采 用附加地形特征数据,如地形特征点、山脊线、谷底线、断裂线,以描述地形结构。 格网 DEM 的 另 一 个 缺 点 是数据 量过 大 , 给 数 据 管 理带来 了不 方便 , 通 常 要 进行压 缩存 储。 DEM 数 据 的 无 损 压 缩 可以采 用普 通的 栅格 数据 压缩方 式, 如游 程编 码、 块码等 ,但 是 由于 DEM 数 据 反 映 了 地 形的连 续起 伏变 化, 通常 比较“ 破碎 ” ,普 通压 缩方式 难 以 达 到 很 好的效 果; 因此 对于 网格 DEM 数 据 , 可 以采 用哈 夫 曼编码 进行 无损 压缩 ; 有 时, 在 牺 牲 细 节信息 的前 提下 , 可 以 对 网 格 DEM 进 行 有 损 压 缩 , 通常的 有损 压缩 大都 是基 于离散 余弦 变 换( Discrete Cosine Transformation, DCT)或 小波 变 换 ( Wavelet Transformation)的 ,由 于 小波变 换具 有较 好的 保持 细节的 特性 , 近年 来将 小波变 换 应 用 于 DEM数据 处理 的研究 较多 。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 2. 2 等高线模型 等高线 模型 表示 高程 ,高 程值的 集合 是已 知的 ,每 一条等 高线 对应 一个 已知 的高程 值 , 这样一系列等高线集合和它们的高程值一起就构成了一种地面高程模型。如图 9-3 所示。 图 9-3:等高线 等高线 通常 被存 成一 个有 序的坐 标点 对序 列 , 可 以 认 为是一 条带 有高 程值 属性 的简单 多 边形或 多边 形弧 段。 由于 等高线 模型 只表 达了 区域 的部分 高程 值, 往往 需要 一种插 值方 法来 计算落 在等 高线 外的 其它 点的高 程, 又因 为这 些点 是落在 两条 等高 线包 围的 区域内 ,所 以 , 通常只使用外包的两条等高线的高程进行插值。 等高线通常可以 用二维的 链表来存储。另 外的一种 方法是用图来表 示等高线 的拓扑关 系, 将等 高线 之间的 区域 表示成 图的 节点 , 用 边表 示等高 线本 身 。 此方 法满 足等高 线闭 合 或 与边界 闭合 、 等高线 互不 相交两 条拓 扑约 束。 这类 图可以 改造 成一 种无 圈的 自由树 。 下 图 为 一个等高线图和它相应的自由树(图 9-4) 。其它还有多种基于图论的表示方法。 B A F C G E H D 图 9-4:等高线和相应的自由树 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 2. 3 不规则三角网( TIN)模型 尽管规则格网 DEM 在计算和应用方面有许多优点,但也存在许多难以克服的缺陷: 1)在地形平坦的地方,存在大量的数据冗余; 2)在不改变格网大小的情况下,难以表达复杂地形的突变现象; 3)在某些计算,如通视问题,过分强调网格的轴方向。 不规则 三角 网 ( Triangulated Irregular Network, TIN) 是另外 一种 表示 数字 高程 模型的 方 法 [Peuker 等, 1978], 它 既 减少规 则格 网方 法带 来的 数据冗 余 , 同 时 在 计 算 ( 如坡度 ) 效 率 方面又优于纯粹基于等高线的方法。 TIN 模型 根据 区域 有限 个 点集将 区域 划分 为相 连的 三角面 网络 , 区域 中任 意点落 在 三 角 面的顶 点 、 边 上或三 角形 内。 如果 点不 在顶点 上 , 该点的 高程 值通 常通 过线 性插值 的方 法得 到 ( 在边 上用 边的 两个 顶 点的高 程 , 在 三 角 形 内 则 用三个 顶点 的高 程) 。所 以 TIN 是一 个三 维空间的分段线性模型,在整个区域内连续但不可微。 TIN 的数 据存 储方 式比 格 网 DEM 复杂 , 它 不仅 要存 储每个 点的 高程 , 还 要存 储其平 面 坐标、 节点 连接 的拓 扑关 系, 三 角 形 及 邻 接 三 角 形 等关系 。 TIN 模 型 在 概 念 上类似 于多 边形 网络的矢量拓扑结构,只是 TIN 模型不需要定义“岛”和“洞”的拓扑关系。 有许多 种表 达 TIN 拓扑 结 构的存 储方 式, 一个 简单 的记录 方式 是: 对于 每一 个三角 形、 边和节 点都 对应 一个 记录 , 三 角 形 的 记 录 包 括 三 个 指向它 三个 边的 记录 的指 针; 边 的 记 录 有 四个指 针字 段, 包括 两个 指向相 邻三 角形 记录 的指 针和它 的两 个顶 点的 记录 的指针 ; 也 可以 直接对每个三角形记录其顶点和相邻三角形( 图 9-5) 。每个节点包括三个坐标值的字段 , 分别存 储 X, X, Z 坐 标 。 这种拓 扑网 络结 构的 特点 是对于 给定 一个 三角 形查 询其三 个顶 点 高程和 相邻 三角 形所 用的 时间是 定长 的, 在沿 直线 计算地 形剖 面线 时具 有较 高的效 率。 当然 可以在 此结 构的 基础 上增 加其它 变化 , 以 提高 某些 特殊运 算的 效率 , 例 如在 顶点的 记录 里增 加指向其关联的边的指针。 邻 接三角形 1 X Y Z 2 X Y Z 3 X Y Z 4 X Y Z 5 X Y Z 6 X Y Z 7 X Y Z 8 X Y Z 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 1 2 3 4 顶点 5 6 8 7 5 4 2 3 6 5 7 4 6 5 4 4 8 8 8 7 2 1 X 3 1 2 6 4 5 3 4 X X 5 8 7 X 6 2 8 6 7 X X 点文 件 三 角形文 件 1 1 1 2 5 4 4 3 图 9-5:三角网的一种存储方式 不规则 三角 网数 字高 程由 连续的 三角 面组 成 , 三 角 面 的形状 和大 小取 决于 不规 则分布 的 测点, 或节 点的 位置 和密 度。 不 规 则 三 角 网 与 高 程 矩阵方 法不 同之 处是 随地 形起伏 变化 的复 杂性而 改变 采样 点的 密度 和决定 采样 点的 位置 , 因 而它能 够避 免地 形平 坦时 的数据 冗余 , 又 能按地形特征点如山脊、山谷线、地形变化线等表示数字高程特征。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 2. 4 层次模型 层次地 形模 型 ( Layer of Details, LOD) 是 一种 表达 多 种不同 精度 水平 的数 字高 程模型 。 大多数 层次 模型 是基 于不 规则三 角网 模型 的, 通常 不规则 三角 网的 数据 点越 多精度 越高 , 数 据点越 少精 度越 低 , 但 数 据 点多则 要求 更多 的计 算资 源。 所以 如果 在精 度满 足要 求的情 况下 , 最好使 用尽 可能 少的 数据 点。 层次 地形 模型 允许 根据 不同的 任务 要求 选择 不同 精度的 地形 模 型。层次模型的思想很理想,但在实际运用中必须注意几个重要的问题: 1)层次模型的存储问题,很显然,与直接存储不 同,层次的数据必然导致数据冗余。 2)自动 搜索 的效 率问题 , 例如搜 索一 个点可 能先 在 最粗的 层次 上搜索 ,再 在 更细的 层 次上搜索,直到找到该点。 3)三角网形状的优化问题,例如可以使用 Delaunay 三角剖分。 4)模型 可能 允许 根据地 形 的复杂 程度 采用不 同详 细 层次的 混合 模型, 例如 , 对于飞 行 模拟,近处时必须显示比远处更为详细的地形特征。 5)在表 达地 貌特 征方面 应 该一致 ,例 如,如 果在 某 个层次 的地 形模型 上有 一 个明显 的 山峰,在更细层次的地形模型上也应该有这个山峰。 这些问题目前还没有一个公认的最好的解决方案,仍需进一步深入研究。 3. DEM 模型之间的相互转换 在实际 应用 中, DEM 模型 之间可 以相 互转 换。 大部 分 DEM 数据 都是 规则 格 网 DEM, 但由于 规则 格 网 DEM 的 数据量 大而 不便 存储 , 也可 能由于 某些 分析 计算 需要 使用 TIN 模型 的 DEM, 如 进行 通视 分析 。 此 时需 要将 格网 DEM 转成 TIN 模型的 DEM。 反之, 如果 已有 TIN 模型的 DEM 数据,为满足某种应用的需要,也需要转成规则格网的 DEM。 3. 1 不规则点集生成 TIN 对于不 规则 分布 的高 程点 , 可 以 形 式 化地描 述为 平 面的一 个无 序的 点 集 P, 点 集中每 个 点 p 对应 于它 的高 程值 。 将该点 集转 成 TIN, 最 常 用的方 法是 Delaunay 三角剖分方 法。 生 成 TIN 的关 键是 Delaunay 三角网 的产 生算 法, 下 面先对 Delaunay 三角网和 它的 偶图 Voronoi 图作简要的描述。 Voronoi 图, 又叫 泰森 多边 形或 Dirichlet 图,它 由一 组连续 多边 形组 成, 多边 形的边 界 是由连 接两 邻点 线段 的垂 直平分 线组 成 。 N 个 在 平 面上有 区别 的点 , 按 照 最 近邻原 则划 分平 面: 每个 点与 它的 最近 邻 区域相 关联 。 Delaunay 三 角形是 由与 相 邻 Voronoi 多边形 共享 一条 边的相 关点 连接 而成 的三 角形 。 Delaunay 三角形 的 外接圆 圆心 是与 三角 形相 关的 Voronoi 多 边形的一个顶点。 Delaunay 三角形是 Voronoi 图的偶图,如图 9-6 所示。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 图 9-6: Delaunay 三角网与 Voronoi 图 对于给定的初始点集 P,有多种三角网剖分方式,而 Delaunay 三角网有以下特性: 1)其 Delaunay 三角网是唯一的; 2)三角网的外边界构成了点集 P 的凸多边形“外壳” ; 3)没有 任何 点在 三角形 的 外接圆 内部 ,反之 ,如 果 一个三 角网 满足此 条件 , 那么它 就 是 Delaunay 三角网。 4) 如果将 三角 网中 的每 个 三角形 的最 小角 进行 升序 排列 , 则 Delaunay 三角网 的排列 得 到的数值最大,从这个意义上讲, Delaunay 三角网是“最接近于规则化”的三角网。 下面简要介绍 Delaunay 三角形产生的基本准则: Delaunay 三角形产 生准 则 的最简 明的 形式 是: 任何 一个 Delaunay 三角形的 外 接圆的 内 部不能 包含 其它 任何 点 [Delaunay 1934]。 Lawson[1972]提出 了最 大化 最小 角原 则: 每两 个相 邻的三 角形 构成 的凸 四边 形的对 角线 , 在 相互 交换 后, 六 个 内 角 的 最 小 角 不 再增大 。 Lawson [1977]又提 出了 一个 局部 优化 过程 LOP( Local Optimization Procedure) 方 法。 如图 9-7 所示。 先求 出包 含新 插入 点 p 的外 接圆 的三 角形 ,这 种三 角形 称为 影响 三角 形( Influence Triangulation) 。 删 除 影 响 三角形 的公 共边 (图 b 中 粗线) ,将 p 与全 部影 响三 角形的 顶点 连 接,完成 p 点在原 Delaunay 三角形中的插入。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 图 9-7:向 Delaunay 三角形中插入点 将该点集转成 TIN,最常用的方法是 Delaunay 三角剖分方法,生成过程分两步完成: 1)利用 P 中点集的平面坐标产生 Delaunay 三角网; 2)给 Delaunay 三角形中的节点赋予高程值。 3. 2 格网 DEM 转成 TIN 格网 DEM 转成 TIN 可 以 看作是 一种 规则 分布 的采 样点生 成 TIN 的特 例, 其目 的 是 尽 量减 少 TIN 的顶 点数 目, 同时尽 可能 多地 保留 地形 信息, 如山 峰、 山脊 、谷 底和坡 度突 变 处 。 规则 格网 DEM 可 以 简 单地生 成一 个精 细的 规则 三角网 , 针 对它 有许 多算 法, 绝 大 多 数 算法都有两个重要的特征: 1)筛选要保留或丢弃的格网点; 2)判断停止筛选的条件。 其中两个代表性的方法算法是保留重要点法和启发丢弃法。 3. 2. 1 保留重要点法 该 方法是 一种 保留规 则格网 DEM 中的 重要点来 构造 TIN 的方法 [Chen、 Gauvara ( 1987) ]。 它是通过 比较计 算格网点 的重要性 ,保留 重要的格 网点。重 要点( VIP, Very Important Point)是 通过 3*3 的模板来确 定的 ,根 据 八邻点 的高 程值 决定 模板 中心是 否为 重 要点。 格网 点的 重要 性是 通过它 的高 程值 与 8 邻点 高程的 内插 值进 行比 较, 当差分 超过 某个 阈值的 格网 点保 留下 来。 被保留 的点 作为 三角 网顶 点生 成 Delaunay 三角网。 如图 9-8 所示 , 由 3*3 的模板得 到中 心 点 P 和 8 邻点 的高 程值 , 计 算 中 心 点 P 到直 线 AE, CG, BF, DH 的 距离 , 图 右图 表示 , 再 计 算 4 个距 离的 平均 值。 如果 平 均 值 超 过 阈值, P 点为 重 要点, 则保 留,否则去除 P 点。 P A B C D E F G H Z AEP d 图 9-8: VIP 方法示意 3. 2. 2 启发丢弃法( DH— Drop Heuristic) 该方法 将重 要点 的选 择作 为一个 优化 问题 进行 处理 。 算 法 是 给 定 一 个 格 网 DEM 和转 换 后 TIN 中节 点的 数量 限制 ,寻求 一个 TIN 与规 则格 网 DEM 的最 佳拟 合。 首先 输 入 整 个 格 网 DEM,迭 代进 行计 算, 逐渐将 那些 不太 重要 的点 删除, 处理 过程 直到 满足 数量限 制条 件 或满足一定精度为止。具体过程如下(图 9-9) : 1)算 法的 输入是 TIN,每 次去掉 一个 节点 进行 迭代 ,得到 节点 越来 越少的 TIN。很 显 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 然 , 可以 将格 网 DEM 作为 输入, 此时 所有 格网 点视 为 TIN 的节 点, 其方 法是将 格 网 中 4 个 节点的其中两个相对节点连接起来,这样将每个格网剖分成两个三角形。 2) 取 TIN 的一 个节点 O 及 与其相 邻的 其它 节点 , 如图 9-9 所示 , O 的邻 点 (称 Delaunay 邻接点 ) 为 A, B, C, D,使 用 Delaunay 三 角 构造算 法, 将 O 的邻 点进 行 Delaunay 三角形 重构,图 9-9 中实线所示。 3)判 断该 节点 O位于 哪个新 生 成 的 Delaunay三角形 中, 如 图 9-9 为三 角形 BCE。计算 O 点的高 程和 过 O点与 三角形 BCE交点 O’的高 程差 d。 若高程 差 d大于 阈值 d e ,则 O点为 重要 点, 保留,否则,可删除。 d e 为阈值。 4)对 TIN 中所有的节点,重复进行上述判断过程。 5)直到 TIN中所有的节点满足条件 d>d e ,结束。 图 9-9: DH 方法转换格网 DEM 成 TIN (左图虚线为以 O 为中心的 Delaunay 三角形,实线为新生成的 Delaunay 三角形; 右图为高差的计算 [注意:此图描述了三维空间 ]) 两种 方法相比 较 [Lee, 1991], VIP 方法在保 留关键网格 点方面( 顶点、凹 点)最 好; DH 方法 在每 次丢 弃数 据点时 确 保 信 息 丢 失 最 少 , 但 要 求 计 算 量大。 各种 方法各 有 利弊, 实 际应用 中根 据不 同的 需要 , 如 检 测 极 值点, 高效 存储 , 最 小 误差, 可以 选择 使用 不同的 方法 。 3. 3 等高线转成格网 DEM 表示地 形的 最常 见的 线模 式是一 系列 描述 高程 曲线 的等高 线 。 由于 现有 地图 大多 数 都 绘 有等高 线 , 这 些地图 便是 数字高 程模 型的 现成 数据 源, 可以 将纸 面等高 线图 扫描后 , 自 动 获 取 DEM 数据 。 由于 数字 化 的等高 线不 适合 于计 算坡 度或制 作地 貌渲 染图 等地 形分析 , 因此 , 必须要把数字化等高线转为格网高程矩阵。 使用局部插值算法,如距离倒数加权平均或克里金插值算法 * ,可以将数字化等高线数 据 转为规则 格网的 DEM数据 ,但插值 的结果 往往会出 现一些许 多不令 人满意的 结果,而 且 数字化 等高 线时 越小 心, 采样点 越多 , 问题越 严重 。 问 题不 在于 计算插 值权 重系数 的理 论 假 设, 也 不 在 于 平 滑 等 高 线 是真实 地形 的反 映的 假设 , 而 在 于 估 计 未 知 格 网 点 的高程 要在 一个 半径范 围内 搜索 落在 其中 的已知 点数 据, 再计 算它 的加权 平均 值。 如果 搜索 到的点 都具 有相 同的高 程, 那待 插值 点的 高程也 同为 此高 程值 。 结 果导致 在每 条等 高线 周围 的狭长 区域 内具 有与等 高线 相同 的高 程, 出现了 “阶 梯” 地形。 当 低海拔 平原 地区 等高 线距 离更远 时, 搜索 到 一条等高 线上的 数据的可 能性就越 大,问 题更严重 。以带“ 阶梯” 地形的 DEM为基础 , 计算坡度往往会出现不自然的条斑状分布模式(图 9-10) 。 * 见“空间分析”一章中的“空间插值”节。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 图 9-10:等值线插值造成“阶梯地形”的原因 最好的 解决 方法 是使 用针 对等高 线插 值的 专用 方法 。 如 果 没 有 合 适 的 方 法 , 最 好把等 高 线数据 点减 少到 最少 , 增 加标识 山峰 、 山 脊、 谷底 和坡度 突变 的数 据点 , 同 时使用 一个 较大 的搜索窗口。 3. 4 利用格网 DEM 提取等高线 在 利 用格网 DEM 生成 等 高线时 , 需 要 将 其 中 的 每 个点视 为一 个几 何点 , 而 不是一 个矩 形 区 域 , 这 样可 以根 据格网 DEM 中相 邻四 个点 组 成四边 形进 行等 高线 跟踪 。 其 方法 类似 于 后面描 述的 利 用 TIN 提取 等高线 。实 际上 ,也 可以 将每个 矩形 分割 成为 两个 三角形 ,并 应 用 TIN 提取 等高 线算 法, 但是由 于矩 形有 两种 划分 三角形 的方 法, 在某 些情 况下, 会生 成 不同的等高线(图 9-11) ,这时需要根据周围的情况进行判断并决定取舍。 ( a) (b) 图 9-11:由于三角形划分不同造成生成等高线的不同 在格 网 DEM 提 取 等 高线中 , 除 了划 分为 三角 形之外 , 也 可以 直接 使用 四边形 跟 踪 等 高 线。但 是在 图 9-11 所 示 的 情形中 ,仍 会出 现等 高线 跟踪的 二义 性, 即对 于每 个四边 形, 有 两条等 高线 的离 去边 。 进 行取舍 判断 的方 法一 般是 计算距 离, 距离 近的 连线 方式优 于距 离远 的连线方式。在图 9-11 种,就要采用( b)图所示的跟踪方式。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 格网 DEM 提 取 等 高 线 另 一个值 得注 意的 问题 是, 如果一 些网 格点 的数 值恰 好等于 要提 取的等 高线 的数 值, 会使 判断过 程变 得复 杂, 并且 会生成 不闭 合的 等高 线, 一般的 解决 办 法 是将这些网格点的数值增加一个小的偏移量。 3. 5 TIN 转成格网 DEM TIN转成格 网 DEM可 以 看 作普通 的不规 则点生 成格 网 DEM的 过程。 方法 是按 要求的 分 辨率大 小和 方向 生成 规则 格网, 对每 一个 格网 搜索 最近的 TIN数据 点, 按线 性或 非 线 性 插 值 函数计算格网点高程 * 。 4. DEM 的建立 为了建立 DEM,必需量测一些点的三维坐标,这就是 DEM 数据采集。 4. 1 DEM 数据采集方法 1)地面测量 利用自 动记 录的 测距 经纬 仪 ( 常 用 电 子 速 测 经 纬 仪 或全站 经纬 仪) 在野 外实 测。 这 种 速 测经纬 仪一 般都 有微 处理 器, 可 以 自 动 记 录 和 显 示 有关数 据, 还能 进行 多种 测站上 的计 算工 作。其记录的数据可以通过串行通讯,输入计算机中进行处理。 2)现有地图数字化 利用数 字化 仪对 已有 地图 上的信 息 ( 如等 高线) 进行 数字化 的方 法, 目前 常用 的数字 化 仪有手扶跟踪数字化仪和扫描数字化仪。 3)空间传感器 利用全球定位系统 GPS,结合雷达和激光测高仪等进行数据采集。 4)数字摄影测量方法 这是 DEM 数 据 采 集 最 常 用的方 法之 一。 利用 附有 的自动 记录 装置 (接 口) 的立体 测图 仪或立 体坐 标仪 、 解 析测 图仪及 数字 摄影 测量 系统 , 进 行人 工、 半自 动或 全 自动的 量测 来获 取数据。 4. 2 数字摄影测量获取 DEM 数字摄 影测 量方 法是 空间 数据采 集最 有效 的手 段, 它具有 效率 高、 劳动 强度 低的优 点 。 数据采 样可 以全 部由 人工 操作, 通常 费时 且易 于出 错; 半 自 动 采 样 可 以 辅 助 操作人 员进 行采 样,以 加快 速度 和改 善精 度,通 常是 由人 工控 制高 程 Z,由机 器自 动控 制平 面坐标 X,Y 的 驱动;全自动方法利用计算机视觉代替人眼的立体观测,速度虽然快,但精度较差。 人工或 半自 动方式 的数 据 采集, 数据 的记录 可分 为 “点模 式” 或“流 模式” , 前者根 据 控制信号记录静态量测数据,后者是按一定规律连续地记录动态的量测数据。 摄影测 量方 法用 于生 产 DEM, 数 据 点 的 采 样 方 法 根 据 产品的 要求 不同 而异 。 沿 等高线 、 断面线 、 地 性 线进行 采样 往往是 有目 的的 采样 。 而 许多产 品要 求高 程矩 阵形 式, 所以 基于 规 * 具体的计算方法见第五节第二部分。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 则格网 或不 规则 格网 点的 面采样 是必 须的 , 这 种方 式与其 它空 间属 性的 采样 方式一 样, 只是 采样密度高一些。 1)沿等高线采样 在地形 复杂 及陡 峭地 区, 可采用 沿等 高线 跟踪 方式 进行数 据采 集, 而在 平坦 地区, 则不 宜采用 沿等 高线 采样 。 沿等 高线采 样时 可按 等距 离间 隔记录 数据 或按 等时 间间 隔记录 数据 方 式进行 。 采用 后一 种方 式 , 由于在 等高 线曲 率大 的地 方跟踪 速度 较慢 , 因 而 采 集 的点较 密集 , 而在等 高线 较平 直的 地方 跟踪速 度快 , 采集的 点较 稀疏 , 故 只要 选择恰 当的 时间间 隔 , 所 记 录的数据就能很好地描述地形,又不会有太多的数据。 2)规则格网采样 利用解 析测 图仪 在立 体模 型中按 规则 矩形 格网 进行 采样, 直接 构成 规则 格 网 DEM。当 系统驱 动测 标到 格网 点时 ,会按 预先 选定 的参 数停 留一短 暂时 间( 如 0.2 秒) ,供作 业人 员 精确测 量。 该方 法的 优点 是方法 简单 、 精 度高 、 作 业效率 也较 高; 缺点 是对 地表变 化的 尺度 的灵活性较差,可能会丢失特征点。 3)渐进采样( Progressive Sampling) 渐进采 样方 法的 目的 是使 采样点 分布 合理, 即平 坦地 区样点 少, 地形 复杂 区的 样点 较 多 。 渐进采 样首 先按 预定 比较 稀疏的 间隔 进行 采样 , 获 得一个 较稀 疏的 格网 , 然 后分析 是否 需要 对格网 进行 加密 ,如图 9-12 所示。 判断 加密 的方 法 可利用 高程 的二 阶差 分是 否超过 了给 定 的阈值 ; 或 利用 相邻 的三 点拟合 一条 二次 曲线 , 计 算两点 间中 点的 二次 内插 值与线 性内 插值 之差, 判断 是否 超过 阈值 。 当 超 过 阈 值 时 , 则 对 格 网加密 采样 , 然 后对 较密 的格网 进行 同样 的判断 处理, 直至不 再超 限或达 到预先 给定的 加密 次数( 或最小 格网间 隔) , 然后再 对其它 格网进行同样的处理。 图 9-12:渐进采样 4)选择采样 为了准 确地 反映 地形 , 可 根据地 形特 征进 行选 择采 样, 例如 沿山 脊线 、 山 谷 线 、 断 裂 线 进行采 集以 及离 散碎 部点 (如 山顶 ) 的 采集 。 这 种方 法获取 的数 据尤 其适 合于 不规则 三角 网 DEM 的建立。 5)混合采样 为了同 步考 虑采 样的 效率 与合理 性, 可将 规则 采样 ( 包括渐 进采 样) 与选 择性 采样结 合 进行混 合采 样 , 即在 规则 采样的 基础 上再 进行 沿特 征线 、 点 采样 。 为 了区 别 一般的 数据 点和 特征点 , 应 当 给不同 的点 以不同 的特 征码 , 以 便处 理时可 按不 同的 方式 进行 。 利 用混 合采 样 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 可建立附加地形特征的规则格网 DEM,也可建立附加特征的不规则三角网 DEM。 6)自动化 DEM 数据采集 上述方 法均 是基 于解 析测 图仪或 机助 制图 系统 利用 半自动 的方 法进 行 DEM 数据采 集, 现在已 经可 以利 用自 动化 测图系 统进 行完 全自 动化 的 DEM 数据 采集 。 此 时可 按像片 上的 规 则格网利用数字影像匹配进行数据采集。 最后数 字摄 影测 量获 取 的 DEM 数据 点都 要按 一定 插值 方 法 转 成 规 则格网 DEM 或规 则 三角网 DEM 格式数据。 4. 3 DEM 数据质量控制 数 据 采集是 DEM 的 关 键 问题, 研究 结果 表明 ,任 何一 种 DEM 内插 方法 ,均 不 能 弥 补 取样不 当所 造成 的信 息损 失。 数 据 点 太 稀 会 降 低 DEM 的精 度; 数据 点过 密, 又会增 大数 据 量、 处 理 的 工 作 量 和 不 必 要的存 储量 。 这 需要 在 DEM 数据 采集 之前 , 按 照所 需的精 度要 求 确定合 理的 取样 密度 , 或者在 DEM数据 采集 过程 中根 据地形 复杂 程度 动态 调整 采样点 密度 。 由于很 多 DEM 数据 来源 于地形 图, 所 以 DEM 的 精度决 不会 高于 原始 的地 形图。 例如 U.S.G.S.用数 字化 的等 高线 图, 通过 线性 插值 生产 的最 精确 的 DEM 的最 大均 方 误 差 ( RMSE) 为等高线间距 的一半,最 大误差不大于 两个等高线 间距。通常用 某种数学拟 合曲面生产 的 DEM,往往存 在未知 的精度 问题,即 使是正 式出版的 地形图同 样存在 某种误差 ,所以在 生 产和使用 DEM 时应该注意到它的误差类型。 DEM 的数 据质 量可 以参 考 美 国 U.S.G.S.的分 级标 准 ,共分 为三 级: 第一 级, 最大绝 对 垂直误 差 50 米、 最大 相对 垂直误 差 21 米, 绝大 多数 7.5 分幅 产品 属于 第一 级 ; 第 二 级 DEM 数据对 误差 进行 了平 滑和 修改处 理 , 数 字 化 等 高 线 插值生 产 的 DEM 属 于第二 级, 最大 误差 为两个 等间 距, 最大 均方 误差为 半个 等间 距; 第三 级 DEM 数据 最大 误差 为 一个等 间距 , 最 大均方误差为三分之一个等间距。 5. DEM 的分析和应用 5. 1 格网 DEM 应用 5. 1. 1 地形曲面拟合 DEM 最基 础的 应用 是求 DEM 范围 内任 意点 的高 程 ,在此 基础 上进 行地 形属 性分析 。 由于已 知有 限个 格网 点的 高程, 可以 利用 这些 格网 点高程 拟合 一个 地形 曲面 , 推 求 区 域 内 任 意点的 高程 。 曲 面拟 合方 法可以 看作 是一 个已 知规 则格网 点数 据进 行空 间插 值的特 例, 距离 倒数加权平均方法,克里金插值方法,样条函数等插值方法均可采用。 5. 1. 2 立体透视图 从数字 高程 模型 绘制 透视 立体图 是 DEM的 一 个 极 其 重要的 应用 。 透视 立体 图能 更好地 反 映地形 的立 体形 态, 非常 直观 。 与 采用 等高线 表示 地形形 态相 比有 其自 身独 特的优 点 , 更 接 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 近人们 的直 观视 觉。 特别 是随着 计算 机图 形处 理工 作的增 强以 及屏 幕显 示系 统的发 展, 使立 体图形 的制 作具 有更 大的 灵活性 , 人 们可 以根 据不 同的需 要, 对于 同一 个地 形形态 作各 种不 同的立 体显 示 。 例如 局部 放大 , 改 变高 程值 Z的 放 大倍率 以夸 大立 体形 态; 改变视 点的 位 置 以便从 不同 的角 度进 行观 察, 甚至 可以 使立 体图 形转 动, 使人 们更 好地 研究 地形 的空间 形态 。 从一个 空间 三维 的立 体的 数字高 程模 型到 一个 平面 的二维 透视 图 , 其本 质就 是一 个 透 视 变换。 将 “ 视点 ” 看 作为 “摄影 中心 ” , 可 以 直 接 应 用共线 方程 从物 点 ( X,Y ,Z ) 计算 “ 像 点”坐标 (X,Y) 。透视图中的另一个问题是“消隐”的问题,即处理前景挡后景的问题。 调整视 点、 视角 等各 个参 数值, 就可 从不 同方 位、 不 同距离 绘制 形态 各不 相同 的透视 图 制作动画。计算机速度充分高时,就可实时地产生动画 DTM透视图。 5. 1. 3 通视分析 通视分 析有 着广 泛的 应用 背景。 典型 的例 子是 观察 哨所的 设定 , 显 然观 察哨 的位置 应该 设在能 监视 某一 感兴 趣的 区域, 视线 不能 被地 形挡 住。 这 就 是 通 视 分 析 中 典 型的点 对区 域的 通视问 题 。 与 此类似 的问 题还有 森林 中火 灾监 测点 的设定 , 无 线 发射塔 的设 定等 。 有 时还 可 能对不 可见 区域 进行 分析 , 如 低空 侦察 飞机在 飞行 时, 要尽 可能 躲避敌 方雷 达的捕 捉 , 飞 行 显然要选择雷达盲区飞行。通视问题可以分为五类 [Lee,J.( 1991) ]: 1)已知一个或一组观察点,找出某一地形的可见区域。 2)欲观察到某一区域的全部地形表面,计算最少观察点数量。 3)在观察点数量一定的前提下,计算能获得的最大观察区域。 4)以最小代价建造观察塔,要求全部区域可见。 5)在给定建造代价的前提下,求最大可见区。 根据问 题输 出维 数的 不同 , 通 视可 分为 点的通 视 , 线的通 视和 面的 通视 。 点 的通视 是指 计算视 点与 待判 定点 之间 的可见 性问 题 ; 线的 通视 是指已 知视 点 , 计算 视点 的视野 问题 ; 区 域的通 视是 指已 知视 点 , 计算视 点能 可视 的地 形表 面区域 集合 的问 题 。 基 于 格 网 DEM 模型 与基于 TIN 模型的 DEM 计算通视的方法差异很大。 图 9-13:通视分析,图上灰色区域为不可见区域 1)点对点通视 基于格 网 DEM 的 通 视 问 题 , 为 了简 化问 题, 可以 将格网 点作 为计 算单 位。 这样点 对点 的通视问题简化为离散空间直线与某一地形剖面线的相交问题。 (图 9-13) 已知视 点 V的坐 标为 ( x 0 ,y 0 ,z 0 ) ,以 及 P点的 坐标 ( x 1 ,y 1 ,z 1 ) 。 DEM为二 维数 组 Z[M][N], 则 V为( m 0 ,n 0, Z[m 0 ,n 0 ]) , P为( m 1 ,n 1, Z[m 1 ,n 1 ]) 。计算过程如下: ( 1. 1)使 用 Bresenham 直 线算法 , 生 成 V 到 P 的 投 影直线 点集 {x , y}, K=||{x , y}||, 并 得到直 线点 集 {x , y}对应 的高程 数据 {Z[k], ( k=1,...K-1 )},这样形 成 V 到 P 的 DEM 剖面 曲 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 线。 ( 1. 2)以 V 到 P 的 投影直 线为 X 轴, V 的投 影点 为原点 , 求 出视 线在 X-Z 坐标系 的 直线方程: ]][[ ]][[]][[ ][ 00 1100 nmZk K nmZnmZ kH +? ? = ( 0<k<K) K 为 V 到 P 投影直线上离散点数量。 ( 1. 3)比较数组 H[k]与数组 Z[k]中对应元素的值,如果 []1,1, ?∈? Kkk 存在 Z[k]>H[k],则 V 与 P 不可见,否则可见。 2)点对线通视 点对线 的通 视, 实际 上就 是求点 的视 野。 应该 注意 的是, 对于 视野 线之 外的 任何一 个地 形表面 上的 点都 是不 可见 的, 但在 视野 线内 的点 有可能 可 见 , 也可 能不 可见 。 基于 格网 DEM 点对线的通视算法如下: ( 2. 1)设 P 点为 一沿 着 DEM 数 据 边 缘 顺 时 针 移 动 的点, 与计 算点 对点 的通 视相仿 , 求出视点到 P 点投影直线上点集 {x, y},并求出相应的地形剖面 {x, y, Z(x, y)}。 ( 2. 2)计算视点至每个 与 Z 轴的夹角 : (){} 1,...2,1,,,, ?=∈ Kkyxzyxp k k β g247 g247 g248 g246 g231 g231 g232 g230 ? = vppk k ZZ k arctgβ ( 2. 3)求得 。{ k βα min= }α 对应的点就为视点视野线的一个点。 ( 2. 4)移动 P 点,重复以上过程,直至 P 点回到初始位置,算法结束。 3)点对区域通视 点对区 域的 通视 算法 是点 对点算 法的 扩展 。 与 点 到 线通视 问题 相同 , P 点 沿 数 据边缘 顺 时针移 动。 逐点 检查 视点 至 P 点的 直线 上的 点是 否 通 视 。 一个 改进 的算 法思 想是 , 视 点 到 P 点的视 线遮 挡点 , 最 有可 能是地 形剖 面线 上高 程最 大的点 。 因 此 , 可 以 将 剖 面线上 的点 按高 程值进 行排 序 , 按降 序依 次检查 排序 后每 个点 是否 通视 , 只 要有 一个点 不满 足通视 条件 , 其 余点不再检查。点对区域的通视实质仍是点对点的通视,只是增加了排序过程。 5. 1. 4 流域特征地貌提取与地形自动分割 地形因 素是 影响 流域 地貌 、 水文、 生物 等过 程的 重要 因子, 地形 属性 的空 间分 布特征 一 直是人 们用 于描 述这 些空 间过程 变化 的重 要指 标。 高精 度 DEM 数据 和高 分 辨率、 高光 谱、 多周期 的遥 感影 像, 为人 们定量 描述 流域 空间 变化 过程提 供了 日益 丰富 的数 据源, 而且 人们 对流域 地貌 、 水 文和 生物 等过程 空间 变化 机理 理解 的不断 加深 , 可 以说 人类 已经进 入了 一个 “空间 模拟 ” 的 时 代 。 基 于 DEM 数据 自动 提取 流 域地貌 特征 和进 行流 域地 形自动 分割 是进 行流域空间模拟的基础技术。 基于格 网 DEM 自 动 提 取 流域特 征地 貌和 进行 地形 自动分 割技 术主 要包 括两 个方面 : 1) 流域地 貌形 态结 构定 义 , 定义能 反映 流域 结构 的特 征地貌 , 建 立 格 网 DEM 对 应的微 地貌 特 征。 2) 特 征地 貌自 动提 取 和地形 自动 分割 算法 。 格 网 DEM 数据 是一 些离 散 的高程 点数 据, 每个数 据本 身不 能反 映实 际地表 的复 杂性 。 为了 从格网 DEM数据 中得 到流 域地 貌形态 结构 , GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 必须采用一个清晰的流域地貌结构模型,然后针对该结构模型设计自动提取算法。 1)流域结构定义 可以使用一 个具有根 的树 状图来描述 流域结构 [Shreve],目前绝大多 数算法 都 沿用这一 描 述 方法。 在此 结构 中主要 包 括 三 个 部 分 , 即 结点集 、 界 线集 和汇 流区 集。 如 图 9-14 所示 。 图 9-14:流域结构 ( a.内部沟谷段 b. 外部沟谷段 c. 内部汇流区 d. 外部汇流区 e. 沟谷结点 f. 汇流源点 g. 分水线段 h. 分水线源点) 其具体内容包括几个概念: 1)沟谷线段:一条具有两侧汇流区的线段; 2)分水线段:一条具有两侧分水区的线段; 3)沟谷结点:两条或两条以上沟谷线的交点; 4)分水线结点:两条或两条以上分水线的交点; 5)沟谷源点:沟谷的上游起点; 6)分水线源点:分水线与流域边界的交点; 7)内部汇流区:汇流区边界不包含流域部分边界的汇流区; 8)外部汇流区:汇流区边界包括部分流域边界的汇流区。 沟谷结 点和 沟谷 源点 共同 组成沟 谷结 点集, 所有 的沟 谷段组 成沟 谷段 集, 形 成 沟 谷网络 ; 所有的 分水 线组 成分 水线 段集, 形成 分水 线网 络。 沟 谷段集 和分 水线 段集 共同 把流域 分割 成 一个汇流区集。 沟谷段 是最 小的 沟谷 单位 , 沟 谷 段 可 以 分 为 内 部 沟 谷段和 外部 沟谷 段。 内部 沟谷段 连接 两个沟 谷结 点 , 外部 沟谷 段连接 一个 沟谷 结点 和沟 谷源点 。 同 样 , 分 水 线 段 是最小 的分 水线 单位 , 也 分为 内部分 水线 段和外 部分 水线 段。 内部 分水线 段连 接两 个分 水线 结点 , 外 部分 水 线段连接一个分水线结点和一个分水线源点。 汇流网 络中 每一 沟谷 段都 有一个 汇流 区域 , 这 些区 域由分 水线 集控 制。 外部 沟谷段 有一 个外部 汇流 区 , 内部 沟谷 段有两 个内 部汇 流区 , 分 布在内 部沟 谷段 两侧 。 整 个流域 被分 割 成 一个个子流域,每个子流域如同树状图上的一片“叶子” 。 2)流域特征地貌自动提取和地形自动分割 特征地 貌定 义与 提取 : 根据 网格点 高程 与周 围高 程值 的关系 , 将格 网点 分为 坡地 、 洼地 、 分水线 、 谷 地、 阶地 和鞍 部等几 类。 先计 算中 心点 与八邻 点的 高程 差, 然后 对高程 差进 行排 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 序, 再 根 据 高 程 差 序 列 的 特性给 中心 点格 网赋 一个 特征编 码。 然后 通过 一系 列特征 码的 组合 特征,用模式识别的方法,将格网点划分到已知的特征地貌类别。 山脊线 和山 谷线 提取 : 山 脊线和 山谷 线的 自动 探测 实际上 是凹 点和 凸点 的自 动搜索 。 较 为简单 的算 子 是 2*2 的局部算子 。 将 算 子 在 DEM 数据 中 滑动, 比较 每个 格网点 与 行 和 列 上 相邻格 网点 的高 程, 标出 其中高 程最 小 ( 探测 山谷 线) 或 高 程 最 大 ( 探测 山脊 线) 的 格 网 点 。 对整个 DEM 数据计算一遍后,剩下的未标记格网点就是山脊线或山谷线上的格网点。 流域地 形自 动分 割: 流域 地形自 动分 割的 目标 是将 整个流 域分 割成 一个 个子 汇流区 。 大 多数算 法是 利 用 3*3 窗口计算流 向和 基于 “溢 流跟 踪”算 法确 定汇 流网 络。 算法过 程如 下 : ( 2. 1)格网点流向定义 采用 3× 3 窗口 按 8 方向 搜索计 算最 大坡 向为 各网 格点的 流向 。分 别 为 8 方 向赋不 同的 代码, 如右 图所 示。 每个 格网有 一个 从 1 到 9 的 数 值 , 代表 它流 向相 邻象 元的 方 向 , 如 该 象 元为凹点,则其值为 5(图 9-15) 。 N 7 8 9 4 6 1 2 3 图 9-15:格网水流方向定义 几种例外情况的处理: A.如果一 个网格点 的最 大坡向格网点 与之具有相 同的高程值, 且之前没有 其它格网点 流向这 个相 邻格 网, 则强 制流向 它 。 如 果还有 另外 的格网 点流 向这 个相 邻格 网, 则当 前格 网 点为凹点。 B.当两个或多个相邻格 网点的最大坡向相等时, 先比较各自相邻格网点坡 向,如果仍 没解决,继续比较相对格网点的坡向,决定赋一个流向。 C. 对 于具 有相 同高 程值 的 区域则 扩大 搜索 窗口 半径 , 用 7× 7 窗 口 , 如 果需 要 还可以 使 用更大窗口。 D.在 DEM 数据 的外 围加 一圈高 程值 为 0 的 格 网 点 , 强 制其 最大 坡向 流向 研究 区 之外。 当所有的格网点处理完毕后,生成一个编码 1— 9 的流向图。 ( 2. 2)凹点处理算法 由于凹 点的 存在 , 有 一些 流路不 会流 向流 域出 口, 而是终 止于 凹点 , 所 以在 进行流 域自 动分割 之前 , 还要对 凹点 进行处 理 。 流 域中凹 点既 可能是 真实 的凹 点, 也可 能是由 于插 值 误 差造成 的 , 所 以不能 使用 简单的 滤波 或平 滑函 数, 将凹点 全部 去除 , 目 的是 将凹点 造成 的 断 路连接到主沟谷网络。 搜索所 有凹 点的 相邻 最低 点 ( 有 时 可 能 有 多 个 高 程 相等的 最低 点) , 作 为 凹 点 的溢出 点, 以溢出 点为起 点继续 搜索 比它的 高程低 或相等 的邻 点(已 经搜索 的点忽 略) , 判断是 否有比 原凹点 更低 的格 网点 , 如 果没有 则以 该凹 点的 溢出 点为起 点 , 重 复上述 搜索 过程 ; 如 果搜 索 到比原 凹点 低的 格网 点 , 将凹点 和最 低邻 点的 方向 倒转 。 如 图 9-15 所示 : 高 程为 48 的点 为 一个凹 点, 搜索 到高 程最 低的邻 点为 49, 以 它 为 起 点继续 搜索 ,找 到高 程点 49,仍 比原 凹 点高程 高, 则继 续搜 索, 又找到 另一 个高 程 点 49,再 找 到高程 47 的点 ,比 原 凹点高 程低 , 结束搜索,按搜索方向修改流向,如图 9-16 中实线箭头方向所示。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 72 66 63 57 52 50 44 68 65 60 53 49 47 50 66 62 49 49 52 57 58 64 48 53 59 60 62 67 67 64 64 66 69 71 75 图 9-16:凹点处理 ( 2. 3)提取汇流网络 根据修 改后 的流 向图 , 给 定一个 点, 所有 流向 它的 格网点 的总 和就 是该 点的 汇流区 。 计 算方法 是给 定一 个点 , 搜 索 8 邻 点 , 记 录所有 流向 它的格 网点 的位 置, 然后 再以找 到的 格 网 点为基 点继 续搜 索记 录流 向它的 格网 点, 直到 没有 新的汇 流点 为止 , 所 有记 录的格 网点 构成 该点的汇流区。 通常沟 谷的 汇流 区面 积大 于其它 格网 点的 汇流 区面 积, 可 以 通 过 设 定 一 个 阈 值 , 将 汇流 区面积 大于 此阈 值的 格网 点, 标识 为沟 谷点 。 很 明 显 , 不 同 的 阈 值得到 的沟 谷网络 的复 杂性 是不同 的, 这种 方法 虽然 为确定 沟谷 网络 的复 杂性 提供了 灵活 性, 但也 使得 沟谷网 络的 确定 具有太大的随意性。 得到沟 谷网 络后 , 可 以对 沟谷网 络进 行编 码。 首先 对沟谷 结点 编码 。 从 流域 出口开 始搜 索遍历 整个 汇流 网络 , 对每 个沟谷 段的 上下 游结 点进 行编码 标识 , 标识 值是 沟谷 段的编 码值 , 并记录 下这 些结 点的 位置 。其次 ,把 沟谷 段中 的每 个格网 点标 识为 沟谷 段的 编码值 。第 三 , 根据沟谷段上游结点的类型判定沟谷段是内部沟谷段还是外部沟谷段。 ( 2. 4)提取分水网络 递归搜 索沟 谷段 中的 每个 格网点 的汇 流区 ,将 汇流 区的格 网点 赋为 该沟 谷段 的标识 值 , 形成各 沟谷 段的 子汇 流区 。 然 后进 行边 界跟踪 , 提 取子汇 流区 的边 界线 为分 水线 , 得 到分 水 线网络 。 最 后 , 对 沟 谷 网 络和分 水线 网络 及子 汇流 区进行 拓扑 编码 , 以 完成 流域地 形的 自动 分割。 5. 1. 5 DEM 计算地形属性 由 DEM 派生 的地 形属 性 数据可 以分 为单 要素 属性 和复合 属性 二种 。 前 者可 由高程 数据 直接计 算得 到, 如坡 度因 子 , 坡向。 后者 是由 几个 单要 素属性 按一 定关 系组 合成 的复合 指标 , 用于描 述某 种过 程的 空间 变化, 这种 组合 关系 通常 是经验 关系 , 也 可以 使用 简化的 自然 过程 机理模型。 单要素地形属性通常可以很容易地使用计算机程序计算得到,包括: 1)坡度、坡向 坡度定 义为 水平 面与 局部 地表之 间的 正切 值。 它包 含两个 成分 : 斜 度— —高 度变化 的最 大值比 率(常 称为坡 度) ; 坡向— —变化 比率最 大值 的方向 。地貌 分析还 可能 用到二 阶差分 凹率和 凸率 。 比较通 用的 度量方 法是 : 斜度用 百分 比度量 , 坡 向 按从正 北方 向起算 的角 度 测 量,凸度按单位距离内斜度的度数测量。 坡度和 坡向 的计 算通 常使 用 3*3 窗口, 窗口 在 DEM 高程矩 阵中 连续 移动 后 , 完成整 幅 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 图的计算。坡度的计算如下: ()()[] 21 22 tan yzxz σσσσβ += 坡向计算如下: ( ) () xzyz A σσσσ?=tan () ππ <<? A 为了提 高计 算速 度和 精度 , GIS 通常 使用 二阶 差分 计 算坡度 和坡 向, 最 简 单 的 有限二 阶 差分法是按下式计算点 i,j 在 x 方向上的斜度: ()( ) xjijiijxz zz σσσ 2/ ,1,1 ?+ ?= 式中 是格网间距( 沿对角 线时 应乘以 x σ x σ 2 ) 。这种方法计 算八各方 向的斜度 ,运 算速度 也快 得多 。 但 地面 高程得 局部 误差 将引 起严 重得坡 度计 算误 差, 可以 用数字 分析 方法 来得到更好得结果,用数字分析方法计算东西方向得坡度公式如下: ()( ) ( )[ ] xjijijijijijiijxz zzzzzz σσσ 822 1,1,11,1_1,1,11,1 ???+?++++ ++?++= 同理可以写出其它方向的坡度计算公式。 2)面积、体积 ( 2. 1)剖面积 根据工程设计的线路,可计算其与DEM各格网边交点P i(X i,Y i,Z i) ,则线路剖面积为 1, 1 1 1 2 + ? = + ? + = g229 ii n i ii D ZZ S 其中n为交点数; D i , i+1 为P i 与P i+1 之距离。同理可计算任意横断面及其面积。 ( 2. 2)体积 DEM体 积 由 四 棱 柱 (无 特征 的格网 ) 与 三 棱 柱 体 积 进 行累加 得到 , 四 棱 柱 体 上 表面用 抛 物双曲 面拟 合 , 三棱 柱体 上表面 用斜 平面 拟合 , 下 表面均 为水 平面 或参 考平 面, 计算 公式 分 别为 g239 g254 g239 g253 g252 ? +++ = ? ++ = 4 4321 4 3 321 3 4 3 S ZZZZ V S ZZZ V 其中S 3与S 4分别是三棱柱与四棱柱的底面积。 根据两个 DEM可计算工程中的挖方、填方及土壤流失量。 3)表面积 对于含 有特 征的 格网 , 将 其分解 成三 角形 , 对 于无 特征的 格网 , 可 由 4个角 点的高 程 取 平均即 中心 点高 程, 然后 将格网 分成 4个 三 角 形 。 由每一 三角 形的 三个 角点 坐标( xi,y i, zi)计算出通过该三个顶点的斜面内三角形的面积,最后累加就得到了实地的表面积。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 5. 2 三角网 DEM 分析应用 5. 2. 1 三角网内插 在建 立 TIN后, 可以 由 TIN解求 该区 域内 任意 一点 的高程 。 TIN的 内插与 矩形 格网的 内 插有不 同的 特点 ,其 用于 内插的 点的 检索 比网 格的 检索要 复杂 。一 般情 况下 仅用线 性内 插 , 即三角 形三 点确 定的 斜平 面作为 地表 面, 因而 仅能 保证地 面连 续而 不能 保证 光滑。 进行 三角 网内插,一般要经过以下几个步骤: 1)格网点的检索 给定一点的 平面坐标P (x ,y) , 要 基 于TIN 内插 该 点 的高程Z,首 先要确 定点P 落在T IN 的哪个 三角形中。一 般的做法是 通过计算距离 ,得到据 P点最近的 点,设为 Q1。然后 就要确 定 P所在的三角形 。依次取出 Q1为顶点的三角形 ,判断 P是否位于该三 角形内。可利用 P是否 与该三 角形 每一 顶点 均在 该顶点 所对 边的 同侧 ( 点 的 坐标分 别代 人该 边直 线方 程所得 的值 符 号相同 ) 加 以判 断。 若P 不 在以Q 1为顶 点的 任意 一个 三角形 中, 则取 离P次 最近 的格网 点, 重 复上述处理,直至取出P所在的三角形,即检索到用于内插P点高程的三个格网点。 2)高程内插 若P (x , y) 所 在 的 三 角 形 为ΔQ 1Q2Q3, 三 顶点 坐标 为 ( x1,y 1,z 1) , (x 2,y 2,z 2)与 ( x3, y3,z 3) ,则由Q 1,Q 2与Q 3确定的平面方程为 0 1 1 1 1 333 222 111 = zyx zyx zyx zyx 或 0 131313 121212 111 = ??? ??? ??? zzyyxx zzyyxx zzyyxx 令 ;; ; ; 13311221 13311221 13311221 zzzzzz yyyyyy xxxxxx ?=?= ?=?= ?=?= 则 P 点高程为 21313121 213131211213131211 1 ))(())(( yxyx xzxzyyzyzyxx ZZ ? ??+?? ?= 5. 2. 2 等高线追踪 基于 TIN 绘 制等 高线 直接 利用原 始观 测数 据, 避免 了 DTM内插 的精 度损 失, 因而等 高线 精度较 高; 对高 程注 记点 附近的 较短 封闭 等高 线也 能绘制 ; 绘 制的 等高 线分 布在采 样区 域内 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 而并不 要求 采样 区域 有规 则四边 形边 界。 而同 一高 程的等 高线 只穿 过一 个三 角形最 多一 次 , 因而程 序设 计也 较简 单。 但是 , 由 于 TIN的存 贮结 构不同 , 等 高 线的具 体跟 踪算法 跟踪 也 有 所不同。 基于三角形搜索的等高线绘制算法如下: 对于记录了三角形表的 TIN,按记录的三角形顺序搜索。其基本过程如下: 1) 对给 定的 等高 线高 程 h, 与 所有 网点 高程 zi( i=1,2,…, n) , 进 行比 较, 若 z i =h,则 将 zi加上 (或 减) 一个 微小 正数ε > 0( 如ε= 10 -4 ) , 以使程 序设 计简 单而 又不 影响等 高线 的精 度。 2)设立 三角 形标 志数组 , 其初始 值为 零,每 一元 素 与一个 三角 形对应 ,凡 处 理过的 三 角形将标志置为 1,以后不再处理,直至等高线高程改变。 3)按顺 序判 断每 一个三 角 形的三 边中 的两条 边是 否 有等高 线穿 过。若 三角 形 一边的 两 端点为P 1(x 1,y 1,z 1) ,P 2(x 2,y 2,z 2)则 (z1-h)(z2-h)<0表明该边有等高线点; (z1-h)(z2-h)>0表明该边无等高线点。 直至搜 索到 等高 线与 网边 的第一 个交 点, 称该 点为 搜索起 点, 也是 当前 三角 形的等 高线 进入 边、线性内插该点的平面坐标(x,y) : g239 g239 g254 g239 g239 g253 g252 ? ? ? += ? ? ? += )( )( 1 12 12 1 1 12 12 1 zz zz yy yy zz zz xx xx 4)搜索 该等 高线 在该三 角 形的离 去边 ,也就 是相 邻 三角形 的进 人边, 并内 插 其平面 坐 标。搜索与内插方法与上面的搜索起点相同,不同的只是仅对该三角形的另两边作处理。 5) 进 入 相 邻 三 角形, 重复 第 (4) 步, 直至 离去 边没 有相邻 三角 形 ( 此时 等高 线为开 曲 线)或相邻三角形即搜索起点所在的三角形(此时等高线为闭曲线)时为止。 6) 对于 开曲 线, 将已 搜索 到的等 高线 点顺 序倒 过来 , 并 回 到 搜 索 起 点 向 另 一 方向搜 索, 直至到达边界(即离去边没有相邻三角形) 。 7)当一 条等 高线 全部跟 踪 完后, 将其 光滑输 出, 方 法与前 面所 述矩形 格网 等 高线的 绘 制相同 。 然 后继 续三 角形 的搜索 , 直 至全 部三 角形 处理完 , 再 改变 等高 线高 程, 重 复 以 上 过 程, 直 到 完 成 全 部 等 高 线 的绘制 为止 (图 9-17) , 图 9-17 描 述了 利用 三角 网 生成数 值 为 50 的等高线的过程。 GIS 空间站 (http://www.gissky.net) 提供 《地理信息系统 --原理、方法和应用》 邬伦等 图 9-17:利用 TIN生成等高线 GIS 空间站 (http://www.gissky.net) 提供 在其中理论 T 的所有有效句子都被满足的一种可能的认识,称为 T 的一个模型。 萨帕斯 一个模型可以是一种理论、一条规律、一种关系、或者一种假说、一个方程式、 一条规则。 斯基林 第十章 空间建模与空间决策支持 导读:本章介绍了“更高层次”的GIS分析功能,第一节讲述了如何利用基本的分 析,如缓冲区、叠加分析,进行组合,以完成特定的功能。 后面几节分别介绍了空间决策支持系统、专家系统、数据仓库、元胞自动机和空间 定位和配置方面的知识,这些内容,或者在其它的领域已经成熟,或者属于新兴的 领域。在GIS的支持下,实现相关功能,并将其应用于空间分析,可以解决更为复 杂的空间问题。 1.空间分析过程及其模型 1. 1 空间分析过程 空间分析的目的是解决某类与地理空间有关的问题,通常涉及多种空间分析操作的组 合。好的空间分析过程设计将十分有利于问题的解决,一般步骤是: 1)明确分析的目的和评价准则; 2)准备分析数据; 3)进行空间分析操作; 4)进行结果分析; 5)解释、评价结果(如有必要,返回步骤 1); 6)结果输出(地图、表格和文档)。 1. 1. 1 例 1:道路拓宽改建过程中的拆迁指标计算 这里将举例说明如何利用建立缓冲区、拓扑叠加和特征提取,计算一条道路拓宽改建过 程中的拆迁指标。 1)明确分析的目的和标准 本例的目的是计算由于道路拓宽而需拆迁的建筑物的建筑面积和房产价值,道路拓宽改 建的标准是: g108g32 道路从原有的20m拓宽至60m; g108g32 拓宽道路应尽量保持直线; g108g32 部分位于拆迁区内的10层以上的建筑不拆除。 2)准备进行分析的数据 本例需要涉及两类信息,一类是现状道路图;另一类为分析区域内建筑物分布图及相关 信息。 3)进行空间操作 首先选择拟拓宽的道路,根据拓宽半径,建立道路的缓冲区。 然后将此缓冲区与建筑物层数据进行拓扑叠加,产生一幅新图,此图包括所有部分或全 部位于拓宽区内的建筑物信息。 4)进行统计分析 首先对全部或部分位于拆迁区内的建筑物进行选择,凡部分落入拆迁区且楼层高于 10 层以上的建筑物,将其从选择组中去掉,并对道路的拓宽边界进行局部调整。 然后对所有需拆迁的建筑物进行拆迁指标计算。 5)将分析结果以地图和表格的形式打印输出。 1. 1. 2 例 2:辅助建设项目选址 本例说明如何利用空间操作和特征提取功能,为一建设项目选择最佳的建设位置。 1)建立分析的目的和标准 分析的目的是确定一些具体的地块,作为一个轻度污染工厂的可能建设位置。工厂选址 的标准包括: g108g32 地块建设用地面积不小于10000m 2 ; g108g32 地块的地价不超过1万元/m 2 ; g108g32 地块周围不能有幼儿园、学校等公共设施,以免受到工厂生产的影响。 2)从数据库中提取用于选址的数据 为达到选址的目的,需准备两种数据,一种为包括全市所有地块信息的数据层;另一类 为全市公共设施(包括幼儿园、学校等)的分布图。 3)进行特征提取和空间拓扑叠加 从地块图中选择所有满足条件1、2的地块,并与公共设施层数据进行拓扑叠加。 4)进行邻域分析 对叠加的结果进行邻域分析和特征提取,选择出满足要求的地块。 5)将选择的地块及相关信息以地图和表格形式打印输出。 1. 2 空间分析建模 1. 2. 1 地图模型(Cartographic Model )的概念 模型是人类对事物的一种抽象, 人们在正式建造实物前, 往往首先建立一个简化的模型, 以便抓住问题的要害,剔除与问题无关的非本质的东西,从而使模型比实物更简单明了,易 于把握。同样为了解决复杂的空间问题,人们也试图建立一个简化的模型,模拟空间分析过 程。 空间分析建模, 由于是建立在对图层数据的操作上的,又称为 “地图建模” (Cartographic Modeling)。它是通过组合空间分析命令操作以回答有关空间现象问题的过程,更形式化一 些的定义是通过作用于原始数据和派生数据的一组顺序的、交互的空间分析操作命令,对一 个空间决策过程进行的模拟。地图建模的结果得到一个“地图模型”,它是对空间分析过程 及其数据的一种图形或符号表示,目的是帮助分析人员组织和规划所要完成的分析过程,并 逐步指定完成这一分析过程所需的数据。地图模型也可用于研究说明文档,作为分析研究的 参考和素材。 地图建 模可 以是 一个 空间 分析流 程的 逆过 程, 即从 分析的 最终 结果 开始 , 反 向一步 步分 析为得 到最 终结 果, 哪些 数据是 必须 的, 并确 定每 一步要 输入 的数 据以 及这 些数据 是如 何派 生而来。以下的例子将说明其过程: 假定需 要获 得这 样一 个结 果, 即 要 显 示 出 所 有 坡 度 大于20 度的 地区 。 首 先的 问题是 要生 成这样 一幅 图像 , 哪 些数 据是必 须具 备的 : 如 要生 成一幅 坡度 大于 20度 的图 像, 需要 一幅 反 映所有 坡度 的图 像 , 数 据 库 里有这 样的 图像 吗? 如果 没有 , 就进 一步 沿着 反向 思路 提 问 : “如 要生成 一幅所 有坡度 的图 像,需 要什么 样的数 据?” 。一幅 高程数 据图像 可用 于生成 坡度图 像。 那么 , 这 幅高 程数 据 图像有 没有 呢? 如果 没有 的话 , 生 成该 图像需 要何 种数据 ?这 一过 程一直 持续 , 直 至找 出所 有必备 数据 为止 。 然 后反 向用图 形或 符号 将有 关数 据及其 操作 流程 表示出来就得到一个地图模型。本例表示如图10-1: 坡度 大于 20 度 的地 区 坡 度 图 象 数 字 高 程 图 象 等 高 线 数 据 再分类 坡度计 算 空间插 值 图10-1:提取坡度大于20度的计算流程 图中,矩形框内为数据,箭头表示操作命令,方向表示操作顺序。 1. 2. 2 地图模型实例 地图模 型有 多种 表示 方法 , 为 了 进 一 步 理 解 制 图 建 模过程 , 下 面给 出三 个不 同领域 的地 图模型实例,分别采用了三种不同的表示方法。 1)食草动物栖息地质量评价模型 本例是 一个 食草 动物 栖息 地质量 评价 简化 模型 , 模型 只考虑 了影 响食 草动 物生 存的基 本 因子: 水源、 食物、 和隐 藏条件, 以及 景观 单元 的 面积, 连 通 性 和 破 碎 程 度 的度量 指标。 模 型形式如图10-2所示: 水源 地 植被 类 型 景观 单 元 植被 类 型 景观 单 元 景观 单 元 景观 单 元 饮水难易度 觅食难易度 隐藏难易度 面积 凸度指数 欧拉数 相 对大小 相 对连通性 相 对一致性 景观各 点 栖息质量 景 观单元 栖息 质 量 总体 质 量 复合 栖 息质 量 再分 类 再分 类 再分 类 再分 类 再分 类 再分 类 平均 平均 再分 类 再分 类 再分 类 叠 加(和) 定级 图10-2:食草动物栖息地质量评价模型 图中操 作顺 序从 左向 右, 从 上向下, 矩形 框内 为原 始数 据和派 生中 间数 据以 及结 果数据 , 矩形框连线上面的文字为操作命令。 2)国家森林公园选址模型 本例是 一个 为某 地建 立一 国家森 林公 园确 定大 致范 围, 是 一 个 数 据 源 已 知 , 需 要进行 空 间信息 提取 的模 型。 数据 源包括 公路 铁路 分布 图( 线状地 物) ,森 林分 布图 (面状 地物 ) , 城镇区划图(面状地物)。地图模型可以用下面的形式表示: 表 10-1:国家森林公园选址模型 步骤 操作命令 找出所有森林地区 1 为林地 , 0 为非林地 再分类 合并森林分类图属性相同的相邻多边形的边界 归组 找出距公路或铁路 0.5 公里的地区 缓冲区分析 找出距公路或铁路 1 公里的地区 缓冲区分析 找出非城市区用地 1为非市区, 0 为市区 再分类 找出森林地区、 非市区、 且距 公路或铁路 0.5 至 1 公 里范围内的地区 拓扑叠加分析 合并相同属性的多边形 归组 3)木材毁坏量回归预测模型 根据多年的统计 数字和经 验方程,本例是 一个林场 砍伐木材时木材 毁坏量回 归预测模 型。 模型的因变量有坡度,树径,树高,蓄积量,树木缺矢量。公式如下: 54321 090.5120.1007.0424.0670.1490.2 XXXXXY ???++?= 地图模型可以表示成下面的形式(图 10-3): 坡度 X1 树径 X2 缺失量 X5 蓄积量 X4 树高 X3 1.670 0.424 -5.090 -0.007 -1.120 坡度 X1 树径 X2 缺失量 X5 蓄积量 X4 树高 X3 常数 -2.490 -5.090 木材毁坏量 累 加 因变量 (图 ) × 回归系 数 = 权重 图 图 10-3:木材毁坏量回归预测模型 1. 2. 3 地图模型实现 大多数 GIS软件 提供 了宏 命 令或脚 本描 述语 言 , 可 以 将上述 建立 的各 种地 图模 型表示 成 GIS的操 作命令 序列 ,自 动 批处理 完成 整个 模型 过程 。例如 一个 根据 DEM图像 生成坡 度图 , 可以表达成 GIS命令格式: CALC Slopemap = slope ( DEMmap ) 由多个原始图层生成一个新图可以写成下面的形式: Newmap = f (Map1,Map2,...... ) 式中, f ( ) 表示一个 GIS命令。 一些 GIS软件还 提供 了书 写 复杂函 数的 功能 , 甚 至 可 以在一 个命 令行 里, 使 用 多个函 数 表达一个完整的地图模型,形式如下: Newmap1,Newmap2,......=f1,f2,f3,.......( Map1, Map2,......, Newmap1, Newmap2,......) 式中, Newmap1, Newmap2, ... 为派生的中间图层。 还有一 些 GIS软件提 供了 高 级的可 视化 的地 图建 模辅 助工具 , 用 户 只 需 使 用 其 提供的 工 具在窗 口中 绘出 模型 的流 程图 , 指 定流 程图的 意义 、 所 用的 参数 , 矩 阵等 即 可完成 地图 模型 的设计 , 而 无需 书写 复杂 的命令 程序 。 可 视化 地图 建模工 具为 用户 提供 了高 层次的 设计 工具 和手段,可使用户将更多的精力集中于专业领域的研究(图 10-4) 。 输入图层 命令1 命令2 中间图层1 中间图层2 中间图层3 命令3 命令4 结果 图层 图 10-4:通过流程图表现的 GIS模型 2.空间决策支持模型 区 域 规 划 、 土 地 利 用 规划、 设施 位置 选择 、环 境管理 等都 是有 关空 间行 为的决 策问 题 , 这些问 题的 解决 方案 是由 决策者 或领 域专 家在 专业 领域知 识和 经验 的启 发下 , 在分析 大量 的 空间和 非空 间信 息的 基础 上得到 的 。 空 间 决 策 问 题 大 大超过 了地 理信 息系 统通 常的空 间分 析 功能的要求。 2. 1 空间决策过程的复杂性 决策是 一个 决策 者为 达到 某种目 标或 目标 集合 , 根据 一定的 约束 条件 下在 多种 侯选方 案 里进行 选择 的复 杂过 程。 当采用 数学 表述 形式 表达 一般化 决策 问题 时, 包括 以下几 个构 成部 分: 1)方案集合: 决策问题的方案集合是指可以选择的行动方案集合,记为 A。 2)状态集合: 任 何 一个决 策问题 都面 临一 定的外 界 环境, 称之 为状 态。系 统 各种可 能 的状态,称为状态集合,记为 Q。 3) 损益函 数: 这 是 决 策 分 析中的 一个 重要 概念 。 在 决策问 题中 , 如 果 采 用 策 略 , 假定系统状态出现 ,系统收益 。因此定义映射 为决策问题 的损益函数。在 A、 Q 可数的情况下,可获得损益表如下所示(表 10-2) 。 ()Aaa ∈ (Qqq ∈ ) )(qaW ,= ()RQAW →×: 表 10-2:决策损益表 Q 1 Q 2 ... Q n A 1 W 11 W 12 ... W 1n ... ... ... ... ... A m W m1 W m2 ... W mn 4)目标函数 (决策 准则 ) : 记为 F。损益函 数只 给 出了系 统的 实际 收益 情况 ,但没 给出 收益的 评价 标准, 即 “ 抉 择 ” 时 的优化 准则。 决策 准则对 于不 同的 决策 者、 问题、 方 法 都 是 不同的,它最终决定了方案的形成。 综上所述,可以将一个决策问题记为: {}WQAFUdm ,,,= 其中, F 为目标函数或决策准则, A 为侯选方案集, Q 为状态集, W 为损益函数。 决策学常规方法用于解决普通决策问题,这类问题满足以下条件: g108g32存在决策者希望达到的明确目标; g108g32存在可供决策者选择且可以明确组分的侯选方案; g108g32存在不受决策者控制的系统状态,系统状态集与侯选方案集相互独立; g108g32损益值可以精确数量化, A, Q 均为可数集合。 当系统 状态 集 Q 中状 态数 n=1 时, 为确 定性 决策问 题 ; 当 n>1 时, 且系 统 各状态 出现 的概率 未知 时, 为不 确定 性决策 问题 ; 当 n>1, 且 系 统各状 态出 现的 概率 服从 一个已 知的 概 率分布时,为风险决策问题。 空间决 策与 一般 决策 问题 同样有 确定 性决 策、 不确 定性决 策和 风险 决策 。 确 定性决 策实 际上是 一个 最优 化问 题, 象土地 适宜 性评 价的 多准 则决策 和线 性规 划均 属此 类决策 问题 , 它 们可以 和地 理信 息系 统的 空间分 析功 能完 全集 成。 而大量 的空 间决 策问 题往 往涉及 到结 构 、 非结构 化知 识, 人的 评价 和判断 等不 同形 式的 知识 ,决策 的不 确定 性和 风险 性的成 分很 大 。 以设施 配置 为例 , 领 域专 家已经 有一 组有 关位 置适 宜性的 判别 规则 , 这 些规 则属于 描述 性方 式表达 的知 识 , 设施 位置 的选择 是建 立在 有关 社会 经济 、 地 质条 件、 环境 质 量等因 素分 析的 基础上 的在 判别 规则 启发 下的推 理过 程; 另外 领域 专家还 有有 关社 会经 济、 地质条 件和 环境 质量的 评价 模拟 模型 , 这 些知识 都属 于程 式式 知识 , 设 施 位 置 的 选 择 是 建 立 在定量 模型 计算 分析的基础上估算过程。 随信息 技术 的快 速发 展, 为决策 者提 供了 越来 越多 的空间 和非 空间 的信 息, 包括地 图 、 航片 、 表 格、 遥感 和数 字 测量信 号等 。 决策者 需要 通过知 识和 经验 来有 效的 处理和 理解 这些 海量的 信息 。 而 人类 的知 识可分 为结 构化 和非 结构 化两种 知识 。 结 构化 的知 识有着 高度 结构 化的形 式和 结构 化的 求解 程序, 包括 数学 模型, 统计 方法, 计算 机算 法等 都属 此 类型的 知识 , 它们在 表现 和分 析方 面遵 循固定 的框 架, 大多 数情 况下只 能被 专家 理解 , 又 称为程 式式 知识 ( Procedural Knowledge) 。 然而大 量的 知识 都是 非结 构化的 , 象 人类 的体 验、 直 觉 、 价 值观 , 专 家 经验,本质 上是 定性的 , 不 能用 固定 的程 序进行 表 达 , 又 称为 描述 性知识( Declarative Knowledge) 。 决策者 使用 信息 和知 识, 在解决 结构 化、 非结 构化 和半结 构化 问题 上的 复杂 程度大 不相 同。 以设 施配 置为例 , 在 某些特 定约 束条 件下 配置 最少数 量的 设施 是一 个结 构化问 题 , 可 以 通过最 优化 方法 进行 求解 ; 寻 找 最 优 设 施 配 置 的 所 有可能 的位 置则 是一 个半 结构化 问题 , 涉 及多种 准则 评价 和价 值评 判;为 设施 配置 确定 总体 目标和 总体 方针 政策 则属 非结构 化问 题 , 涉及灵活的定性问题,不能用固定的程式式知识来解决。 总之, 空间 决策 是一 个涉 及多目 标和 多约 束条 件的 复杂过 程, 通常 不能 简单 地通过 描述 性知识 或程 式式 知识 进行 解决 , 往往 要求 综合 地使 用信 息, 领域 专家 知识 和有 效地 交 流 手 段 。 空间决策中信息和知识往往是互相作用的,如图 10-5 所示: 空间决策 知识 信息 收集 表现 存储 检索 处理 显示 获取 表现 存储 推理 分析 图 10-5:空间决策过程 信 息 的 一 侧 处 理 数 据 的收集 、 表 现 、 存储 、 检 索、 处理 和显 示, 用 于 计 算和量 测, 以 及 知识推 理和 更新 。 知 识的 一侧处 理知 识的 获取 、 表 现、 存 储 以 及 推 理 和 分析, 用于处 理事 实、 组织信 息和 原理 。 决 策中 知识和 信息 的相 互作 用是 对传统 信息 技术 的扩 充, 没有知 识推 理不 可能做出智能决策。 地理信 息系 统为 决策 支持 提供了 强大 的数 据输 入、 存储、 检索 、 显 示的 工具, 但是在 分 析、 模拟 和推 理方面 的功 能比较 弱 , 本 质上是 一个 数据丰 富但 理论 贫乏 的系 统, 在解 决复 杂 空间决 策问 题上 缺乏 智能 推理功 能 。 所 以 , 为 解 决 复杂的 空间 决策 问题 , 需 要在地 理信 息系 统的基 础上 开发 智能 决策 支持系 统, 用 于 数 据 获 取 、 输入、 存储、 分析、 输 出 ; 用 于 知 识 表 现和推 理; 用于 自动 学习 , 系 统 集 成 , 人 机 交 互 。 所用的 新技 术包 括人 工智 能技术 , 知 识获 取、 表 现 、 推 理 等 知 识 工 程技术 , 以 及集 成数 据库 、 模 型 、 非 结 构 化 知 识 及 智能用 户界 面的 软件工程技术。 2. 2 空间决策分析的理论和方法 2. 2. 1 效用理论 效用理 论是 决策 分析 的基 础。 事 物 的 不 确 定 性 可 看 作是许 多简 单随 机事 件的 复合。 每一 个简单 随机 事件 是由 两个 互斥事 件 Z 1 和 Z 2 组成 的。 事件 Z 1 发生 的概 率为 P,事 件 Z 2 发生的 概 率为 1— P,则 随机 事件 记为 L( Z 1 , P, Z 2 ) 。在 简单 随机事 件内 引进 “优 先” 或 “偏 好” 的概念 , 并在 随机 事件 集合 的基础 上建 立公 理体 系 , 即 假设在 随机 事件 集合 中存 在下列 条件 : 1)相对偏好顺序; 2)偏好关系具可传递性; 3)简单随机事件间的可比性; 4)偏好关系可以量化; 5)不确定性可以量化; 6)等价随机事件可相互代换。 在这样 的条 件下 可用 一个 数值来 描述 简单 随机 事件 的期望 效益 , 称 之为 效用。 由简单 随 机事件 的效 用可 确定 一般 不确定 事件 的效 用。 在对 事件不 确定 性判 断进 行量 化时, 需要 利用 各种知 识, 如系 统本 身的 特性, 一些 必要 的统 计知 识以及 决策 者根 据经 验对 事件不 确定 性的 主观估算等。 2. 2. 2 决策树 决策分 析中 最常 用的 方法 之一是 决策 树方 法,图 10-6 为典型 的决 策树 。图 中 长方形 小 框表示 由人 选择 的决 策点 。 把 需要 作决 策的问 题过 程画成 示意 图 , 由图 的最 左边出 发 , 在 作 决策之前先 作试验 。例如 有 R个试 验 L r ,费用为 C r ,试验结果有 O 1 ,…, O t ,…, O T 等共 T 个。在 试验 L r 条件下 O t 发生的概 率记为 P rt ( O t ) 。设此时有 d 1 ,… d i ,…, d I 等共 I个备选 决 策方案。若选择决策 di,则这时可能出现 S 1 ,…, S j ,…, S J 共 J种状态。在试验 L r 中出现结 果 O i 时选 取决 策 di的条 件下 , 状态 S j 出现的 概率 记为 P rti (S j )。 此时 可能 有 L种后果 x 1 , …, x l ; , …, x L ,而 P rti (S j )表 示 在实验 L r 中 出现结 果为 O t 时, 选取 决策 d i 而 出 现状态 S i 的 情况下 , S j 发生后 果 x l 的概率, 其效用 记为 U( x l ) 。决策 树的方 法是顺 着树的各 个分校 进行分 析 ,并计算 各种 可能情 况的 概率 大小 , 最后 计算在 这些 条件 下最 终出 现的后 果的 效用 , 将各 种效 用加以 比较 , 从中选取最佳效用所对应的试验与决策作为应取的决策。 图 10-6:决策树示例 2. 2. 3 贝叶斯决策 由于决 策总 是在 事件 发生 之前做 出, 而事 件是 否发 生又不 是确 定的 , 因 此常 采用统 计学 中贝叶斯公式对事件发生的概率作先验估计,这就是贝叶斯方法。 由于事 件的 发生 具有 不确 定性, 这就 使决 策带 有一 定的经 验性 。 人 们对 于风 验的态 度不 同, 对 效 用 估 计 也 不 同 。 对事件 发展 持保 守看 法而 不愿冒 验的 人, 对效 用估 计往往 偏低 ; 倾 向于冒 验的 人, 对效 用的 估计往 往偏 高。 也有 人取 中庸态 度, 对效 用的 估计 介于两 者之 间 。 2. 3 空间决策支持系统 决策支 持系 统( Decision Support System, DSS)是 辅 助决策 者通 过数 据、 模型 、知识 以 人机交互方 式进行 半结 构化或非结 构化决 策的 计算机应用 系统。 它是 在管理信息 系统 ( Management Information System, MIS) 的基础上发 展起来 的, 在 MIS 的基 础 上增加 了非 结 构化问 题处 理 , 模型 计算 和各种 方法 , 为解决 结构 化、 非结 构化 和半结 构化 的问题 提供 了 更 广泛的 方法 。 它 为决 策者 提供分 析问 题、 建立 模型 、 模 拟 决 策 过 程 和 方 案 的 环境, 调用 各种 信息资 源和 分析 工具 , 帮 助决策 者提 高决 策水 平和 质量。 决策 支持 系统 是辅 助管理 者对 半结 构化问 题的 决策 过程 , 支 持而不 是代 替管 理者 的判 断, 提 高 决 策 的 有 效 性 而 不是效 率的 计算 机应用 系统 。 DSS 的 基本结 构 主 要 由 四 个 部 分 组 成,即 数据 部分 、模型 部分、推 理机 部分 、 人机交互部分,如图 10-7 所示。 数据部分推理部分模型部分 人机交互部分 人机交互系统 模型库管理系统 数据库管理系统 知识库 管理系统 模型库 知识库 数据库 推理机 用户 图 10-7: DSS 的组成部分 与 MIS 对应 的, GIS 可以 看作是 用于 空间 决策 的空 间信息 系统 。 GIS 与 MIS 的不同 之 处在于 其数 据模 型和 数据 结构的 复杂 性。 目前 GIS 的分析 功能 还很 弱且 不灵 活,它 的逻 辑 结构和 智能 层次 不能 满足 解决复 杂空 间决 策问 题的 需要, 特别 是那 些非 结构 化的问 题。 为更 好地辅 助空 间决 策 , GIS 需要增加 对描 述性 知识 和程 式式知 识的 处理 功能 , 目 前 GIS 还不 适 合用于对各种知识形式的 处理,不能作为空间决策 支持系统( SDSS)的神经 中枢,但可以 作为它的一个组成部分,即 GIS 可以嵌入到一个 SDSS 中,用于空间信息处理。 空间决 策支 持系 统与 一般 的决策 支持 系统 性质 相同 , 只是更 注重 空间 数据 和空 间问题 的 获取和解决。通常空间决策支持系统包括以下的功能: g108g32不同数据源的空间和非空间数据的获取、输入、存储; g108g32复杂空间数据结构和空间关系表示方法,适于数据查询、检索、分析、显示; g108g32灵活的集成程式式空间知识(数学模型、空间统计)和数据的处理功能; g108g32灵活的功能修改和扩充机制; g108g32友好的人机交互界面; g108g32提供决策需要的多种输出; g108g32提供非结构化空间知识的形式化表达方法; g108g32提供基于领域专家知识的推理机制; g108g32提供自动获取知识或自学习功能; g108g32提供基于空间信息、描述性知识、程式式知识的智能控制机制。 上述这 些功 能要 求超 出了 目前 GIS 的范 围, 需 要 集 成人工 智能 、 知 识工 程、 软件工 程、 空间信息处理和空间决策理论等领域的最新技术。 2. 4 通用智能空间决策支持系统结构体系 空间决 策支 持系 统的 建立 可以解 决特 定领 域的 决策 问题 。 但是 它的 建立 过程 是一 个 花 费 很长时 间的 工程 , 而 且它 也只能 用在 特殊 的领 域, 所以建 立空 间决 策支 持系 统最经 济和 灵活 的方式 是使 用软 件工 程和 知识工 程的 方法 开发 空间 决策支 持系 统开 发环 境 (外 壳或产 生器 ) , 这样领 域专 家就 可以 使用 它快速 高效 地建 立多 种领 域空间 决策 支持 系统 。 也就 是说开 发一 个 通用的 开发 工具 , 决 策者 可以用 来定 制、 修改 、 调 整、 扩 展 空 间 决 策 支 持 系 统以解 决特 定的 空间决策问题。图 10-8 是一个通用空间决策支持系统的结构体系图。 数据 DBMS 问题 用户 模型 MDBMS 知识 专家 专家 系统 壳 图 10-8:通用空间决策支持系统的结构体系图 系统的 核心 是一 个专 家系 统壳 ( Shell) ,它 可以单 独 作为专 家系 统开 发工 具 , 直接控 制 着 SDSS 的 控 制 流 和 信 息 流 , 提 供表 达和 存储 非结 构化领 域知 识, 它还 包含 了推理 控制 、 系 统和用 户界 面和 对外 交流 的元知 识, 以及 非结 构化 空间知 识的 推理 机。 它 是 SDSS 的 大脑。 为使用 空间 和非 空间 数据 , 专 家 系 统 壳 有 一 个 与 外 部数据 库的 接口 , 包 括 GIS, 关 系数 据库 和遥感 信息 系统 。 模 型管 理系统 管理 和处 理程 式式 知识包 括算 法 、 统计 程序 和数学 模型 , 它 也有一 个与 专家 系统 壳的 接口, 可以 通过 专家 系统 壳的元 知识 进行 调用 。 除 了与数 据库 管理 系统、 模型 管理 系统 的接 口外, 友好 的用 户界 面和 知识获 取模 块也 是专 家系 统壳的 基本 组成 部分。 本节重 点讨 论空 间决 策支 持系统 的模 型管 理系 统 , 关 于数据 库管 理系 统在 前面 的章节 已 作了介绍,至于知识库和知识处理将在下节专家系统里讨论。 2. 5 空间决策支持系统的模型管理系统 为解决 自然 和人 文过 程中 出现的 各种 复杂 的空 间问 题, 多年 来学 者们 提出 了大 量的结 构 化模型 ,包 括统 计方 法、 数学模 型、 启发 式程 序、 算法等 ,这 些模 型与 描述 性的知 识不 同 , 具有高 度结 构化 的格 式和 固定的 执行 程序 。 这些 模型 对解决 那些 结构 化的 决策 问题很 有帮 助 作用, 但不 幸的 是, 它 们 的 形式逻 辑和 解决 方法 对决 策者来 说通 常很 难或 需要 花很长 时间 才 能理解 , 尤 其是 那些 非技 术背景 的决 策者 更是 容易 混淆或 不恰 当有 效地 运用 它们, 从而 限制 了这种 类型 的知 识的 有效 利用。 另外 ,这 些结 构化 的模型 要在 GIS 环境 下使 用,还 有一 个 与 GIS 数据 模型 兼容 性的 问题, 模型 与 GIS 数据库 相互操 作是 一个 基本 要求 。所以 空间 决 策支持 系统 需要 适当 地挑 选和组 织有 关的 模型 , 与管 理空间 和非 空间 数据 的数 据库管 理系 统 相对应的,要有一个模型管理系统。模型管理系统应具有下列功能: g108g32帮助用户选择与分析有关的模型; g108g32对多种类型的模型进行分类和维护以支持各种层次的决策过程; g108g32能将模型子模块组合复杂的模型; g108g32提供恰 当的 数据 结构 满足 查询、 分析 、 显 示; 满 足 与 数据库 的嵌 入或 数据 交换 ; 满 足模型与描述性知识的交流; g108g32提供用户咨询和结果解释的友好界面; 空间决策支持系统对模型高效的分类和组织问题是决策支持系统的核心功能。将模型分 类并按不同层次的深度进行组织可以有效的管理和使用模型。 例如可以先按决策问题进行第 一级分类,再按评价条件和状态进行第二级分类,还可以继续进行更深层次的分类。下面给 出一个分类示例: 1)决策问题分类 第一级分类: g108g32环境问题 g108g32土地利用规划问题 g108g32资源分配问题 g108g32设施配置问题 g108g32网络问题 g108g32水文问题 g108g32地质问题 g108g32海岸线问题 假设关心的是网络问题,关于网络问题的各种模型组织成第二级分类,如下所示: g117g32最短路径 g117g32最少搜索路径(Spanning tree )问题 g117g32货郎担问题 g117g32多点通讯问题(Multicast communication ) g117g32运输问题 g117g32商品流问题 对于每个选择的问题,还可以继续细分成更专的类型,如商品流问题,可以继续分成单 商品和多商品流问题。要选择某个专用的模型,用户通过一系列“是或否”的问题向导,直 到找到需要的解决问题的模型。 2)按技术条件分类 表 10-3:决策问题的分类示例 A. 确定性 确定性模型 不确定性模型 随机模型 不精确模型 B. 空间 离散模型 连续模型 C. 过程 静态模型 动态模型 D. 时间 离散模型 连续模型 E. 线性 线性模型 非线性模型 F. 目标 单目标模型 多目标模型 G. 变量 实型 整型 根据上述分类,可以构造一个决策树,将模型分类知识用一种知识表达方式进行表示, 例如本例可以用产生式规则表示,每条路径对应一个规则。本例对确定性分类下共有 2 6 规 则,其中一条规则描述如下: 表 10-4:决策规则 ——————————————————————— IF situition certain AND space discrete AND process static AND time discrete AND system linear AND objectives multiple AND variables real THEN select multiple-objectives, discrete-space, discrete-time linear programming model ——————————————————————— IF situition uncertain AND cause random AND space discrete AND process dynamic AND time discrete AND system linear AND objectives single AND variables real THEN select multiple-stage, single-objective, discrete-space, discrete-time linear stochastic programming model ——————————————————————— 空间决策支持系统除了模型选择的问题外,模型与数据库的交互也是一个重要的问题。 不同的模型具有不同的数据结构和不同的模型与数据库的交互方式。模型要在 GIS 环境下 运行,还有一个与 GIS 数据结构的兼容性问题。 模型与 GIS 有不同层次的交互方式。最低层的交互是将 GIS 作为数据库管理系统,以 文件的方式进行交互,如果模型和 GIS 对文件类型是兼容的,交互只是一个简单地文件选 取问题;如果文件不兼容,就会涉及文件转换的问题。较高层次的交互方式是将 GIS 作为 显示和分析模型结果的图形显示工具。最高层次的交互是二者集成在一个完整的系统里,比 较松散一点的方式是用 GIS 的操作命令(如宏语言)重新实现模型;更紧密的集成是二者 具有支持查询、分析、显示的数据结构。由于模型的多样性,数据结构也是多样的,因此很 难作到 GIS 数据结构与所有模型的结构兼容。所以模型与 GIS 的交互在空间决策支持系统 里允许有多种方式。 3.专家系统 3. 1 专家系统的基本组成 专家系统是人工智能在信息系统中的应用,它是一个智能计算机程序系统,其内部具有 大量专家水平的某个领域知识与经验,能够利用人类专家的知识和解决问题的方法来解决该 领域的问题。专家系统的主要功能取决于大量的知识。设计专家系统的关键是知识表达和知 识运用。专家系统与一般计算机程序最本质的区别在于:专家系统所解决的问题一般没有算 法解,并且往往是要在不完全、不精确或不确定的信息基础上做出结论。一般的专家系统包 括数据库,知识库,推理机,解释器及知识获取五个部分组成,它的结构如图 10-9 所示。 专家知识 知识获取 人机交互界面 推理机 解 释 器 数据库 知识库 专家系统 图 10-9:专家系统结构图 1)知识库 知识库 用于 存取 和管 理所 获取的 专家 知识 和经 验, 供 推理机 利用 , 具有 知识 存储、 检索、 编辑、增删、修改和扩充功能。 2)数据库 用来存放系统推理过程中用到的控制信息,中间假设和中间结果。 3)推理机 用 于 利 用 知 识 进 行 推理, 求 解 专 门 问题, 具有 启发推 理、 算法 推理 ; 正 向、 反 向 或 双 向 推理;串行或并行推理等功能。 4)解释器 解释器 用于 作为 专家 系统 与用户 的 “人 —— 机 ” 接口 , 其功 能是 向用 户解 释系 统 的行为 , 包括: (4.1 ) 咨询 理解 :对 用 户咨询 的提 问进 行“ 理解 ” ,将用 户输 入的 提问 及有 关事实 、 数据和条件、转换为推理机可接收的信息。 (4.2) 结论 解释: 向用 户输出推 理的 结论或 答案 ,并且根 据用 户需要 对推 理过程 进 行解释,给出结论的可信度估计。 5)知识获取器 知识获取 是专 家系统 与专 家的“界 面” 。 知识库 中的 知识一般 都是 通过“ 人工 移植” 方 法获得 , “ 界面” 就是 知识 工程师 (专 家系 统的 设计 者) , 采 用 “ 专题 面谈” , “ 口语记 录分 析” 等方式 获取 知识 ,经 过整 理后, 再输 入知 识库 。为 了提高 知识 工程 师获 得专 家知识 的效 率 , 可以借 助 “ 知识 获取 辅助 工具” 来辅 助专 家整 理知 识或辅 助扩 充和 修改 数据 库。 近 年 来 , 开 始机器学习、机器识别、半自动化等方法获取知识。 3. 2 专家系统的知识处理 3. 2. 1 人工智能与专家系统 人工智 能的 目的 是用 计算 机模拟 人类 , 其 中包 括模 拟人类 的动 作— —机 器人 , 模 拟 人 类 的视听 能力 —— 计算 机视 觉、 听觉 的模 式识别 , 模 拟人类 语言 —— 计算 机自 然语言 , 模 拟 人 脑—— 电脑 。在 模拟 人脑 研究时 ,本 来是 想从 幼儿 开始, 随着 大脑 的发 育过 程模拟 人脑 的 , 但是发现这样模拟难度太大了,转而研究领域专家的思维过程,因为领域专家能够阐述清楚 知识与逻辑。随着专家系统工具软件的出现,许多领域展开了专家系统的研究,其中最成功 的是国际象棋的专家系统。人工智能主要的目的是模拟人脑的功能,但是目前人们对人脑的 思维过程并不十分清楚,因此人工智能的概念也不可能非常清楚。许多人工智能的研究只局 限于形式逻辑的推导,凡是超出了形式逻辑范畴的,都被是认为无法解决的问题。现在理解 的人工智能主要是指用计算机完成逻辑推理的过程。 3. 2. 2 知识表示 知识表示就是知识的形式化,就是研究用机器表示知识的可行的、有效的、通用的原则 和方法。目前常用的知识表示方法有:产生式规则、语义网络法、框架表示法、与或图法, 过程表示法、特征表示法、黑板结构、 Petri 网络法、神经网络等。其中效果最好的是产生 式规则,其它表示方法单独使用的不多,大多是以产生式规则为主体增加和扩展语义、框架 和程式式知识。 产生式规则使用“若 ……,则……。”语句(If…,Then)。“若”可以是一个条件,也可 以是多个条件;“则”也可以是一个结论,也可以是多个结论。也称为正向式推理,有以下 几种情况: 1)一对一: If (1), then (a)。 2)一对多: If (1),then (a), (b), … (n)。 3)多对一: If (1), (2), …,(m); then (a)。 4)多对多: If (1), (2), …,(m); then (a),(b),…,(n)。 If…,then 语句是从已知条件,推论结果的语句,反之,从结果推出条件称为后向式推 理。同样有四种情况,一对一,一对多,多对一,多对多: 1)一对一: Conclusion (a);Need(1)。 2)一对多: Conclusion (a);Need(1),(2),…,(m)。 3)多对一: Conclusion (a),(b),…,(n);Need (1)。 4)多对多: Conclusion (a),(b),…,(n);Need (1),(2),…,(m)。 由此可见,产生式规则的正向式推理与逆向式推理都是在确定性问题中的处理方法。对 于不确定性的问题,产生式规则不能解决问题,需要结合其它的表示方法。 3. 2. 3 知识推理 推理是指依据一定规则从已有的事实推出结论的过程。专家系统中的自动推理是知识推 理,它是专家系统中问题求解的主要手段。 知识推理与知识表示有密切关系,根据知识表示的特点,知识推理方法可分为图搜索方 法和逻辑论证方法两类。 .图搜索方法 在专家系统的知识表示中,许多基本的、常用的表达方式都具有“图”的形式,或者可 以变换为相应的图的形式,而且通常可以用与或图来进行表达。例如,状态空间图、与或图、 语义网格图,以及由产生式规则或框架表示方法所转换的与或图或网络图。 基于图的知识表达,问题求解的知识推理过程,就是从图中相当于初始状态的出发节点 到相当于目标状态的终止节点的路线搜索过程,即搜索从初始状态有效的转移到目标所经历 的最优的或最经济的线路,相应的知识推理方法即图搜索方法。例如,对于具有树状的状态 空间图,称为“问题树”,基本的图搜索方法有:宽度优先搜索、深度优先搜索法等。 .逻辑论证方法 当知识表示采用谓词( Predicate)逻辑或其他形式逻辑方法时,知识推理也可以采取逻 辑论证方法。在这种情况下,求解一个问题相应于证明一个定理或几个定理,问题求解的知 识推理过程,相应于用数理逻辑方法进行定理证明的过程。知识推理方法即逻辑论证方法。 例如,若用一组谓词逻辑表达式 A 描述有关的事实、情况或条件,而用另一组谓词逻辑表 达式 B 描述问题的答案或结论,那么,只要通过逻辑演算方法论证定理 A-B 成立,也就相 应论证了从有关事实、情况和条件出发,可以推出正确的答案或结论 B。 根据问题求解的推理过程是否运用启发性知识,知识推理方法可分为启发推理和非启发 推理两类。 .启发推理 在问题求解的过程中,运用与问题有关的启发性知识,即解决问题的策略、技巧,对解 的特性及其规律的估计等实践经验或知识,以加快推理过程,提高搜索效率,这种推理过程 称为“启发式推理”。例如,在图搜索的推理方法中,利用启发性知识改进的深度优先搜索 法,如局部择优搜索法,最好优先搜索法等,只需要对部分状态空间进行搜索,可提高搜索 效率。 .非启发推理 在问题求解的推理过程中,不运用启发性知识,只按照一般的逻辑法则和控制性知识, 进行通用性的推理。这种方法缺乏对求解问题的针对性,需要进行全状态空间的搜索,而没 有选择最优的搜索途径,大多搜索效率低。例如宽度优先搜索法,虽然是完备的算法,但其 搜索效率低。 根据问题求解的推理过程中结论是否精确,知识推理方法可分为精确推理和不精确推理 两类。 . 精确推理 精确推理是指在专家系统中,把特定领域的知识表示成必然的因果关系、 逻辑关系,推理的结论是肯定的。这种推理是精确推理。 . 不精确推理 在人类知识中,有相当一类属于人们的主观判断,是不精确和含糊的。 由这些知识归纳出来的推理规则也往往是不确定的,基于这种不确定的推理规则进行推理, 形成结论,称为不精确推理。常用的不精确推理方法有概率论方法、可信度方法、模糊子集 法和证据论方法。 根据问题求解过程中特殊和一般的关系,知识推理方法可分为演绎推理和归纳推理;根 据求解推理过程中的推理的方向,知识推理方法可分为正向推理、反向推理和正反向混合推 理三类。 3. 3 空间分类专家系统实例——土地类型分类 空间分类是 GIS 和遥感信息系统最常用的功能,将空间单元归组分类是智能 GIS 的基 本功能。传统的分类基于二值逻辑,认为区域分类界限是明显的,基本空间单元(矢量或栅 格结构)属于且只属于一个空间类别。然而,事实上空间类别之间的界限通常是模糊的,是 渐变的而不是突变的,所以在空间分类中引入模糊逻辑会提高分类的精度。另外空间分类也 是一个基于人们对空间现象的认知和知识的心理判断过程,开发一个带有 GIS 的专家系统 是很有必要的。 当然可以使用那些结构化的分类算法(程式式知识),但是这种方法往往是很机械,且 不能有效地与用户进行关于分类的知识相互交流。专家系统的分类方法则更为灵活、智能, 它不是一个算法,而是一个关于空间分类的抽象和空间数据如何分类的规则,可以在不修改 任何程 序的 情况 下在 知识 库里修 改、 删除 、 增 加专 家和非 专家 的判 断, 分类 知识和 规则 。 基 于规则 的专 家分 类系 统往 往具有 传播 知识 和教 育的 成分 。 下面 是一 个基 于遥 感影 象 的 土 地 类 型专家分类系统实例。 数据采 用 4 波段 LANDSAT MSS 影象 数据 ,分 类系统 所 采 用 的 分 类 依 据如图 10-10 所 示: 空间单元 陆地 水域 清水 混水 无植被 植被 城市和其它用 地 荒地 图 10-10:土地利用分类 由于分 类问 题是 一个 数据 驱动的 过程 , 采 用了 正向 推理方 式。 产生 式规 则是 从领域 专家 获取的,如下表所示,存入知识库。 表 10-5:知识库存储的分类规则 rule r1 If( x1<8.0000,12.0000) and (x4<5.0000,10.0000) then pretype1 is water Certainty is 1 rule r2 If ( x3>=8.0000,12.0000) and (x4>=5.0000,10.0000 ) then pretype1 is land rule r3 If ( pretype1 is water ) and (x1>20.0000,24.0000) and (x2>13.0000,16.0000) and (x3>5.0000,10.0000) then type is turbid Certainty is 1 rule r4 If ( pretype1 is water) and ( x1<=20.0000,24.0000) or (x2<13.0000,16.0000 ) or (x3<=5.0000,10.0000 ) then type is clear Certainty is 1 rule r5 If ( pretype1 is land ) and (x1<17.0000,25.0000) and (x2<13.0000,30.0000) and (x3>27.0000,50.0000) and (x4>30.0000,65.0000) then type is vegetation Certainty is 1 rule r6 If ( pretype1 is land) and ( x1>=17.0000,25.0000) or (x2>=13.0000,30.0000 ) or (x3<=27.0000,50.0000 ) or (x4<=30.0000,65.0000 ) then pretype2 is non-vegetation Certainty is 1 rule r7 If ( pretype2 is non-vegetation ) and (x1>27.0000,39.0000) and (x2<26.0000,52.0000) and (x3>26.0000,49.0000) and (x4>21.0000,41.0000) then type is barren Certainty is 1 rule r8 If ( pretype2 is non-vegetation) and ( x1<20.0000,30.0000) and (x2<20.0000,30.0000) and (x3>20.0000,35.0000) and (x4>15.0000,25.0000) then type is urban_or_other Certainty is 1 根据专 家的 经验 , 不 能武 断的使 用一 个波 段数 值作 为分类 的界 限, 为反 映光 谱反射 的渐 变性, 使用 了模 糊逻 辑方 法表示 推理 规则 。以 规 则 r1 为 例 , 在划分 水域 时不 是只取 波 段 3 ( x3) 的 一个 数值 5 和波段 4( x4) 中 的一 个数 值 8 作为分 类依 据 , 而 是 用 了 模糊集 的方 法 允许渐变特征。模糊集表示如图 10-11。 1 0 8 12 x3 (波 段 3 ) 1 0 5 10 x4 (波 段 4 ) 隶属度 隶属度 图 10-11:模糊集 由于专 家对 分类 规则 非常 确定 , 所 以确 定性 因子 为 1。 若 确定 性水 平的 不同 , 确定性 因 子可在 [0, 1]范围内取值。 分类的 结果 通过 地理 信息 系统进 行显 示, 当 分 类 结 果 精确时, 系统 会自 动显 示分 类结果 。 当分类 结果 存在 误差 时, 混合象 元同 时被 标识 和显 示, 同 时 土 地 类 型 渐 变 造 成的模 糊边 界也 可显示,模糊边界的宽度在土地类型混杂的地方用不同的阀值控制。 4.数据仓库与空间数据挖掘 随 着 卫 星 和 遥 感 技 术 以及其 它自 动数 据采 集工 具的越 来越 广泛 的应 用 , 日 益丰富 的空 间 和非空 间数 据收 集和 存储 于大空 间数 据库 中 , 海 量 的 地理数 据在 一定 程度 上已 经超过 了人 们 能够处 理的 能力 ,从 这些 海量的 数据 中提 取和 发现 地学知 识, 给当 前 GIS 技术提出 了巨 大 的挑战 。新 的需 求推 动着 GIS 从操作 型信 息系 统向 分析型 信息 系统 过渡 ,数 据库系 统最 新 的数据 仓库 和数 据库 知识 发现技 术为 GIS 组织 、管 理海量 空间 和非 空间 数据 提供了 新的 思 路。 GIS 在空 间数 据存 储 、表达 和管 理方 面的 能力 已得到 广泛 的认 可, 增 强 GIS 分析 功能, 提高 GIS 解决 地学 实际 问 题的能 力已 得到 共识 。 GIS 吸收数 据仓 库的 思想 , 将 空间分 析和 空 间数据 挖掘 方法 紧密 集成 ,充分 利用 GIS 数据 存储 、管理 空间 数据 的功 能, 使海量 的地 理 空间数据变成无限的知识,使 GIS 成为智能的信息系统。 4. 1 数据仓库 ( Data Warehouse) 近年来 ,人 们逐 渐认 识到 计算机 系统 存在 两类 不同 的处理 :操 作型 处理 和分 析型处 理 。 操作型 处理 也叫 事务 型处 理, 是 指 对 数 据 库 联 机 进 行的日 常操 作, 通常 是对 一个或 一组 记录 的查询 和修 改 , 主要 为企 业特定 应用 服务 , 对 此人 们关心 的是 响应 时间 、 数 据的安 全性 和 完 整性。 分析 型处 理是 用于 管 理人员 的决 策分 析, 例如 决 策支持 系统 、 专家 系统 和多维 分 析 等 , 经常要访问大量的历史数据。 两者的 巨大 差别 使得 操作 型处理 和分 析型 处理 的分 离成为 必然 , 于是 数据 库由 操作型 环 境发展 成为 操作 型环 境和 分析型 环境 的新 体系 化环 境。 在此 新体 系环 境中 数据 仓库处 于核 心 地位,它是建立决策支持系统的基础。 数据仓 库是 指面 向主 题的 、 集 成的 、 稳 定 的 、 随 着 时 间变化 的数 据集 合 , 用 以 支持管 理 决策。 这一 定义 指出 了数 据仓库 的目 标是 为了 制定 管理的 决策 提供 支持 信息 。 正 象 企 业 为 了 发展要 进行 业务 重组 一样 , 为了支 持管 理决 策需 要也 要按决 策业 务科 目的 要求 重组在 线事 务 处理( OLTP)系统中的数 据,并要按不同决策 ,分 析内容分别组织使之 方便 使用。也就是 说, 数 据 仓 库 是 一 种 把 收 集的数 据转 变成 有意 义的 信息技 术。 数据 可以 来源 于许多 不同 的数 据源,包括不同的数据库系统,甚至来源于不同的操作系统。 用户 数据挖掘、 数据查询、分析 数据仓库 数据集成器 数据源1 数据源2 数据源n 图 10-12:数据仓库体系结构 在把数 据装 载到 数据 结构 重组后 的数 据仓 库之 前, 先要进 行数 据集 成处 理。 这一处 理包 括几个 必不 可少 的操 作步 骤, 以做 到使 数据完 整 、 统一 , 这 就确 保了在 使用 数据仓 库时 其中 的数据是有质量保证的。简而言之,集成就是保证数据准确、到位、没有超出应有的数值范 围、没有重复等。数据仓库中的数据不像在线事务处理系统中的数据那样频繁的修改,所以 它是比较稳定的(极少或根本不修改)。在一次数据分析的执行过程中使用的数据不得变更, 才能保证两次在使用同一组信息进行分析时不会得出不同的答案。数据仓库一般是按周、月 或隔月从在线事务处理系统周期性地更新数据。 典型的数据仓库体系结构如图 10-12,数据从多个操作型数据库和外部文件中抽取,抽 取出来的数据要进行清理、转换和集成,然后装入数据仓库中。装入仓库的数据形式取决于 数据仓库里数据库的设计,一般的数据仓库设计方法是多维数据模型,具体表现为星形模式 或雪花模式。仓库的数据要定期更新以反映源数据的变化。最后使用前端的报表、查询、分 析和数据挖掘等工具来操作和使用数据仓库。在数据仓库管理方面,有一个存储元数据(关 于仓库数据的数据)的中央数据库或数据字典,而监控和管理工具也是必不可少的。 4. 2 数据挖掘(Data Mining) 随着大量的大规模的数据库迅速不断地增长,人们对数据库的应用已不满足于仅对数据 库进行查询和检索。仅用查询检索不能帮助用户从数据中提取带有结论性的有用信息。这样 数据库中蕴藏的丰富知识,就得不到充分的发掘和利用,形成“数据丰富而知识贫乏”的现 象。另外,从人工智能应用来看,专家系统的研究虽然取得了一定的进展。但是,知识获取 仍然是专家系统研究中的瓶颈。知识工程师从领域专家处获取知识是非常复杂的个人到个人 之间的交互过程,具有很强的个性,没有统一的办法。因此,有必要考虑从数据库中发现新 的知识,被称为数据库知识发现(Knowledge Discovery in Databases ,简称 KDD),也叫数据 挖掘( Data Mining)。数据库知识发现或数据挖掘的定义为从数据中提取隐含的、先前不知 道的和潜在有用的知识的过程。数据挖掘技术集成了机器学习、数据库系统、数据可视化、 统计和信息理论等多领域的最新技术,有着广泛的应用前景。 数据挖掘主要分为以下四个步骤: 1)数据选取 数据仓库中的数据并不都与挖掘的信息有关,第一步就是为了只提取“有用的”数据。 2)数据转换 在确定要进行挖掘的数据之后,要对这些数据进行必要的变换,使得数据可以被进一步 的操作使用,通常的变换有: 将定名量转换为定序量,以便于人工神经网络运算; 对已有的属性进行数学或逻辑运算,以创建新的属性。 3)数据挖掘 在数据转换之后,就要进行数据挖掘,数据挖掘的具体技术很多,如分类、回归分析等。 4)结果解释 挖掘的信息要参照用户的决策支持目的进行分析,并且要表现给决策者。这样,结果的 输出不仅包含可视化的过程,而且要经过过滤,以去掉决策者不关心的内容。 当执行完一个挖掘过程后,有时可能需要重新修改挖掘过程,还可能增加其它数据,数 据挖掘过程可以通过适当的反馈反复进行,如图 10-13 所示。 数据仓库 选取的数据 数据选取 数据转换 数据挖掘 信息提取 转换的数据 提取的信息 消化的知识 图 10-13:知识挖掘过程 数据挖 掘涉 及的 学科 领域 和方法 很多 , 有多种 分类 法。 根据 知识 发现任 务 , 可分为 分类 或预测 模型 发现 、 数 据总 结、 聚 类 、 关 联 规 则 发 现 、 序列 模式 发现 、 依 赖关 系或依 赖模 型发 现、 异 常 和 趋 势 发 现 等 等 ; 根据 知识 发现 对象 , 可 分为关 系数 据库 、 面 向对 象数据 库、 空间 数据库、时 间数据库、文本数据源、 多媒体数据库、异质数据 库、 Web 数据库;根据知 识 发现方 法, 可粗 分为 机器 学习方 法、 统计 方法 、神 经网络 方法 和数 据库 方法 。机器 学习 中 , 可细分 为归 纳学 习方 法 (决 策树、 规则 归纳 等 )、 基 于 范例学 习、 遗传 算法 等。 统计方 法中 , 可细分 为回 归分 析 (多元 回归 、 自 回 归 等 )、 判 别分 析 (贝叶斯 判别 、 费 歇尔 判别 、 非 参 数 判 别 等 )、 聚 类分 析 (系 统 聚 类 、 动态聚 类等 )、 探 索性 分析 (主元分 析法 、 相 关分 析法 等 )等。 神经 网络方 法中 ,可 细分 为前 向神经 网络 (BP 算法 等 )、 自组织 神经 网络 (自组 织特 征映射 、竞 争 学习等 )等。数据库方法主 要是多维数据分析或在线事务处理方法,另外还有面向属性的归 纳方法。 4. 3 空间数据挖掘 空间数 据是 与占 有一 定空 间的对 象有 关的 数据 , 空间 数据库 是通 过空 间数 据类 型和空 间 关系存 储和 管理 空间 数据 。 空 间 数 据 通 常 具 有 拓 扑 和距离 信息 , 通 过空 间索 引进行 组织 和查 询。 空 间 数 据 特 有 的 性 质 给空间 数据 库的 知识 发现 提出了 挑战 和机 遇。 空间 数据库 的知 识发 现或空 间数 据挖 掘, 可以 定义为 从空 间数 据库 中提 取隐含 的知 识、 和没 有直 接存储 的空 间关 系、空间模式的过程。 空间数 据挖 掘技 术, 特别 是空间 数据 理解 、 空 间和 非空间 数据 关系 发现 、 空 间知识 库构 造、 空间 数据 库的 查询 优 化和数 据组 织 , 在 GIS、 遥 感 、 影 象 数 据 库 、 机器 人运动 等涉 及空 间数据的应用系统中很有前景。 下面简要介绍目前空间数据挖掘使用的一些方法: 1)统计分析方法 目前空 间数 据分 析最 常用 的方法 是统 计分 析方 法。 统计分 析非 常适 合处 理数 值型数 据 , 统计分 析方 法多 年来 积累 了大量 的算 法, 可以 用于 对空间 现象 建模 和分 析。 但空间 统计 分析 也有很 大的 缺陷 :首 先统 计分析 方法 关于 空间 分布 数据的 统计 独立 性的 假设 ,往往 不现 实 , 因为空 间邻 域之 间存 在着 相互关 系 ; 其 次 , 统 计 分 析不适 合处 理非 数值 型数 据, 如空 间对 象 的名称 和定 名数 据类 型等 。 另 外 统 计 分 析 往 往 对 领 域专家 和统 计方 面的 知识 要求较 高, 只适 合领域 专家 和有 统计 经验 的人使 用, 而且 当数 据不 完整或 不充 分时 , 统 计分 析的结 果缺 乏实 际意义 。 再 就 是统计 分析 的计算 代价 也是 很高 的。 为克服 统计 分析 方法 的缺 点, 需要 新的 数 据挖掘方法。 2)基于概括的方法 基于概 括的 方法 是一 种面 向属性 的归 纳学 习方 法, 用于空 间数 据挖 掘, 可将 空间和 非空 间属 性的关系 概括成高层次 的概念知 识。它需要背 景知识, 即概念层次体 系( Concept Hierarchy) ,常以概 念树 的 形式给 出。 如 图 10-14 所 示的是 一个 农业 土地 利用 的概念 树。 同 样地,空间数据也存在类似地概念层次,如乡镇——县市——省——国家。 面向属 性的 归纳 学习 方法 , 通 过 概 念 树 攀 升 而 得 到 概括的 数据 , 概 括的 数据 可直接 转换 成规则 或逻 辑表 达式 , 可 用于发 现普 遍特 征规 则和 区划规 则。 空间 数据 库的 归纳学 习可 以根 据非空 间数 据的 概念 层次 , 也 可 根 据 描 述 空 间 数 据 的概念 层次 进行 。 基 于非 空间数 据的 概念 层次归纳,例如数值型数据可以归到一个数值范围或一个较高层次概念描述型变量, ( -9℃ 在-10℃ -0℃范 围, 或“寒 冷” ) ,通 过低 层次的 数值 不同的 数据概 括为较 高层 次的相 同的数 据, 这 些 由 不 同 元 组 的 数 据和它 们的 空间 对象 指针 一起合 并为 高层 次数 据, 表示一 个新 的空 间属性 。 基 于空 间数 据的 概念层 次归 纳, 可以 通过 区划划 分或 空间 存储 结构 如四叉 树进 行定 义。 农作物 经济作 物 粮食作 物 水果 蔬菜 水稻 小麦 黄瓜 土豆苹果柑橘 图 10-14:概括归纳示例 基于概 括的 方法 一般 有以 非空间 数据 为主 的概 括和 以空间 数据 为主 的概 括两 种算法 。 这 两种算 法的 第一 步都 是选 取用户 特定 的查 询数 据。 接下来 , 非 空间 数据 为主 的概括 算法 过程 是: ( A)概念树攀升 ,即 将元组的属性变为高层次 的属性; ( B)属性删除 , 删除那些不可 能 概括的 特殊 属性值 ; ( C) 合并标 识后 的元组 。归纳 过程直 到所 有的属 性概括 到合适 的层 次为止 。 最 后 将概括 后属 性值相 同的 相邻 区域 合并 , 结 果得 到一 幅概念 层次 较高的 、 而 区 域 较少的图。 以空间 数据 为主 的概 括算 法, 第 一 步 也 是 收 集 用 户 查询的 数据 , 然 后根 据给 定的空 间数 据概念 层次 对空 间对 象进 行合并 , 概 括过 程直 到达 到需要 的概 念层 次为 止。 然后对 于每 个概 括后的空间对象进行非空间数据概括,直到得到所有区域的正确描述。 3)聚类方法 聚 类 分 析 是 统 计 分 析 的一个 分支 , 这 种方 法的 主要优 点是 不需 要背 景知 识, 可 以 直 接 从 数据中发现感兴趣的结构或聚类模式,类似于机器学习中的非监督学习。 聚类分 析与 面向 属性 归纳 推理结 合, 为描 述相 似对 象的空 间行 为提 供了 可能 , 或 用 于 判 定不同 类别 的特 征。 同样 可分为 以空 间数 据为 主和 以非空 间数 据为 主两 种方 法。 以 空 间 数 据 为主的 方法 ,首 先通 过基 于采样 的高 效的 聚类 算法 将与任 务有 关的 空间 对象 (如点 )分 类 , 接着对非空间数据使用面向属性归纳推理方法,提取描述各类一般属性。 以非空 间数 据为 主的 方法 , 首 先 将 与 任 务 有 关 的 空 间对象 概括 到较 高的 概念 层次, 进行 聚类分析,然后将空间对象进行合并处理。 4)空间关联规则( Spatial Association Rule)方法 关联规 则的 提出 源于 交易 数据集 中发 现商 品之 间隐 含的相 互依 赖关 系 。 如 果 在 超市的 数 据库中 发现 的一 条规 则, 形式为 “ Wg191B( C%) ” , 规则的 含义 是“ 如果 交易 中出现 了 W 模 式, 就 有 C%的 可 能 性 (可信 度) 出现 B 交易 模式 ” 。 例如规 则 “ 牛 奶 g191黄油 ( 90%) ” ,表 明 有 90%的买牛奶的顾客会同时买黄油,这就是关联规则。它同样可用于发现空间关系。 空间关联规则的形式为: %)( 2121 cQQQPPP nm ∧???∧→∧???∧ 谓词 中至少有一个是空间谓词; C%为关联规则的可信度。 nm QQQPPP ?????? 2121 ,,, 构造空间 关联 规则的 空间 谓词有很 多形 式,例 如拓 扑关系( 相交 、包含 、重 叠等) 、方 位关系(左侧、西侧等) 、距离关系(临近、远离等) 。 关联规 则通 常可 以分 为两 种: 布尔 型关 联规 则和 多值 关联规 则 。 多值 关联 规则 比较 复 杂 , 一种自 然的 想法 是将 它转 换为布 尔型 关联 规则 。 当 全部属 性的 取值 数量 都是 有限的 时候 , 只 需将每 个属 性值 映射 为一 个布尔 型属 性即 可。 当属 性的取 值范 围很 宽时 , 则 需将其 分为 若干 区段 , 然 后将 每个区 段映 射为一 个布 尔型 属性 。 于 是, 如何 划分 区段是 实现 多值关 联规 则 到 布尔型 关联 规则 转变 的关 键。 这里 面有 两个互 相牵 制的问 题 : 当 区段的 范围 太窄时 , 则 可 能 使每个 区段对 应的属 性的 支持度 很低, 而出现 “最 小支持 度问题” ;当 区段的 范围太 宽时, 则可能使每个区段对应的属性的可信度很低,而出现“最小可信度问题” 。 在 一 个集合 S 里, 空间 联 结谓词 的支 持度k PPPP ∧???∧= 21 (SPσ ) ,为 满 足 P 的对 象数与 S 集合总数 的 比;集合 S 里 关 联规则 Pg191Q 的 可信度 )( SQP ∧? 为 )( SQP ∧? / ()SPσ 。 关联规则的发现可以分解成以下两个子问题: ( 4. 1)找 出数 据 库 S 中 所有满 足用 户指 定最 小支 持度的 对象 集 P(一 个非空 子 集 ) , 具有最小支持度的对象集称为频繁对象集,反之就称为非频繁对象集。 ( 4. 2) 利 用频 繁对 象集 生成所 需要 的关 联规 则 。 对于每 一个 频繁 对象 集 P,找 出 P 的 所有非空子集 Q,如果比率 )( SQP ∧? / (SPσ ) ≥最小可信度,就生成关联规则 Pg191Q。 下面简要介绍一下空间关联规则的算法过程: 输入:空间数据库、挖掘查询、关联约束条件集 g108g32数据库 包括 三部 分: 包含 空间对 象的 空间 数据 库、 描述非 空间 信息 的关 系数 据库 、 概念层次集; g108g32查询也包括三 部分:要描述的对象类 S、与任务有关的空间对象子 类 C 1 , ...C n 、有 关的关系和谓语集; g108g32三个约 束条 件 : 每 个 概 念 层次上 的最 小支 持度 、 最 小可信 度 、 满 足 “ 临 近 ” 空间谓 语的最大距离。 输出:有关对象的多种概念层次上的较强的空间关联规则 方法:空间关联发现的计算程序如下: 1 )生成要描述的对象类的图层 1 2)对于相关对象的所有子类对象 Ci 同时进行如下处理: g108g32生成关联对象子类的图层 2; g108g32生成作用于对象 C i 的谓词(如图层 1 与图层 2 相交,给定距离条件) ; g108g32将对象 C i 的谓词加入到谓词数据库中。 3)搜索谓词数据库中可信度高的空间关联规则。 空 间 谓 词 存 在 一 个 扩 展的关 系数 据库 —— 谓词 数据库 中, 属性 值为 单值 或多值 集合 。 谓 词数据库的一个记录描述对象类S 中的一个对象S i 与满足谓词关系的对象C j 的关系。 5. GIS 空间分析与空间动态建模 目前, GIS 已被广泛接受为管理、存储、查询分析有关地理空间分布的信息的成熟的工 具和技术,近年来对 GIS 提出的越来越多的挑战是将这个本质上静态的系统变为支持模拟 空间——时间过程的经济可行的工具,为科学研究和资源管理服务。目前大多数 GIS 软件 不能支持多学科领域的动态过程计算模型,包括水文、生态等地学和生物科学,大多数 GIS 系统只是为模型提供输入参数和显示输出结果。集成 GIS 空间分析与空间动态建模困难的 原因在于: 1)领域科学家、数据收集者和 GIS 技术人员存在着重要的概念差异,导致他们对现实 世界抽象方式、如何用计算机组织和结构化数据的方式存在很大差异。 2) GIS 记录、存储的数据可能不是模型最适合的数据格式,有时需要进行转换。 3)除非对计算机编程非常熟悉,否则编写一个空间过程的动态模型是一个困难的很花 费时间的过程。 3) 许多 GIS 软件的可视化方法并不支持对模型结果的交互式空间——时间表现。 5)满足许多科学家要求的、快速有效的模拟动态模型的开放系统模拟方法(如元胞自 动机),在 GIS 实现的很少。 所谓空间动态模型是指现实世界中地球表面特定位置上的某些属性或状态因其驱动力 随时间变化而发生改变的一种数学模拟。从计算的角度考虑,空间动态模型就是要计算各空 间单元随其时间序列信息或驱动力的变化而产生新状态或属性值。各时刻的状态或属性可以 用计算机以动画的形式进行显示,其实质仍然是图形代数和地图模型的自然延伸。但由于 GIS 空间分析功能的语义限制,不能直接支持空间动态建模的操作元语,所以目前很多模型 都是在 GIS 支持下,经过扩展或修改,采取与 GIS 相互结合的方式实现的。 5. 1 GIS 与空间动态模型的结合方式 GIS 与空间动态模型的结合主要有三种方式:松散结合,交互界面和镶嵌结合。松散结 合主要用于模型与 GIS 各自开发的情形,在这种结合中,先用 GIS 查询,预处理空间数据, 然后按模型所需的格式将其输入模型,模型计算的结果再转为 GIS 文件格式,进行显示和 分析。松散结合的优点在于无须改变模型的代码,不足之处在于大量的数据管理和转换工作, 要求模型和 GIS 两方面的专门知识。第二种结合方式是开发交互界面。这种结合就是开发 支持模型的 GIS 数据库,同时开发一个界面,既可以为模型提供输入数据,又能利用模型 结果进行处理和演示,所有的数据转换是通过交互界面自动进行的。此类结合的实例最多, 交互界面的优点在于提供了模型与 GIS 平台的接口,节省了大量数据输入输出工作。不足 在于编程和数据管理上的投资比较大,用户修改和重写模型的难度大。第三种方式是镶嵌结 合。这类结合要么是一个简单的 GIS 嵌入到一个复杂的模型系统以提供结果显示和交互控 制功能,要么是用 GIS 的函数命令重写模型。这样模型和 GIS 同在一个系统中,二者共用 同一个数据库,不存在数据交换问题。当模型对 GIS 的功能要求不多时常采用前一种镶嵌 方法。而用 GIS 函数命令重写模型的优点在于用户可以建立自己的模型,不足在于 GIS 的 命令和函数有时不能满足建立模型的所有需要。 5. 2 元胞自动机简介 元胞自动机( Cellular Automata, CA )是定义在一个具有离散、有限状态的元胞组成 的元胞空间上的,按照一定局部规则,在离散的时间维上演化的动力学系统。元胞自动机的 基本单元是元胞( Cell),每个元胞具有一个状态,这个状态只能取有限状态集中的一个, 例如“生”或“死”,或者 256 种颜色中的一种等等;这些元胞规则地排列在被称为“元胞 空间”的空间格网上;它们各自的状态随着时间变化,根据一个局部的规则来进行更新,即 一个元胞在某时刻的状态取决于且只取决于该元胞周围邻域元胞的状态;元胞空间内的元胞 依照此局部规则进行同步的状态更新,整个元胞空间则表现为在离散的时间维上变化。 元胞自动机的最基本的组成包括元胞( Cell) ,元胞空间( Lattice) ,邻域( Neighbor) ,规则 (Rule )。元胞自动机可以视为由一个元胞空间和定义在该空间的变换函数所组成。标准的 元胞自动机是一个四元组: A=( d, S, N, f) A 代表一个元胞自动机系统; d 是一个正整数,表示元胞自动机的维数; S 是元胞的有限的 离散的状态集合; N 表示一个所有邻域内元胞的组合,即包含个不同元胞状态的空间矢量, 记为: N = ( s 1 , s 2 , s 3 , ..., s n ) n是邻域内元胞的个数;s i ∈Z(整数集合) , i∈(1,2,...n); f是变化规则,为将S n 映射到S 上的 一个局部转换函数。所有的元胞位于 d维空间上,其位置可用一个 d元的整数矢量Z d 来确定。 一般地,元胞自动机的基本模型具有五个主要特征: 1)它们由元胞的离散格局构成; 2)它们在离散时间步序内演化; 3)每一元胞的状态均在同一有限集中取值; 4)每一元胞的状态依同一确定的法则演化; 5)元胞状态的取值法则仅依赖于其自身及其周围邻域元胞的状态值。 元胞自动机虽然是产生于并行计算机结构的一种理论模型,但它还可用来描述具有很大 自由度的离散系统,可视为偏微分方程离散化的理想形式。元胞自动机模型可用来模拟研究 很多的现象,包括信息传递、计算、构造、生长、复制、竞争与进化等,同时,它为动力学 系统理论中有关秩序、紊动、混沌、非对称、分形等系统整体行为与现象的研究提供了一个 有效的模型工具。 元胞自动机模型具有很强的灵活性和开放性,它不是一个简单的数理方程,而更象是一 种方法论。各领域专家可对模型的各个组成部分进行灵活的扩展,建立适合模拟各种专题现 象的扩展模型,这是元胞自动机广泛应用于社会、经济、环境、地学、生物等领域的原因。 尤其需要说明的是当元胞自动机在二维空间上时,元胞空间结构与栅格 GIS 数据结构高度 相容,因此使用栅格 GIS 结合元胞自动机模型,可以用于离散时间和离散空间的框架下对 复杂时空动态过程进行模拟。下面以一个林火模型的实例对 GIS 与元胞自动机模型的结合, 模拟林火时空动态蔓延过程。 5. 3 元胞自动机模拟林火蔓延模型 森林火灾是一种常见的自然灾害,当森林火灾发生时,快速准确地模拟和预测火势的蔓 延和发展,对于及时部署灭火力量,搬迁居民,减少人民生命财产损失,具有重大的实际意 义。林火模型中最成功的是 Rothermel 的林火蔓延模型,模型主要考虑的因素有: 1)森林的材质:包括燃料物质载荷、燃料深度、燃料粒子密度、热容量、灭火所需湿 度等。 2)燃料湿度、空气温度。 3)风速、风向。 4)地形坡度。 模型可以计算林火的蔓延速率,火灾的强度、范围和面积等。 基于该模型的框架,一些研究人员结合元胞自动机原理和 GIS,建立了新的林火模型。 该模型是一个二维元胞自动机模型,基本假设条件有:森林均匀分布,材质均一;地形为平 原,不考虑地形影响;风向随机,即不考虑风向影响。模型的特征如下: 元胞空间:元胞空间是将实际研究区按照一定分辨率划分的离散网格,格网单元为正方 形单元,与 GIS 栅格数据结构一致。 元胞状态:每个元胞具有四种状态, 0 代表无森林覆盖, 1 代表未燃森林, 2,代表正在 燃烧森林,3 代表已烧过的森林。 邻域定义:每个元胞以 8 个相邻元胞作为其邻域元胞。 转换规则:林火蔓延规则,即在燃元胞的扩展规则。我们假定在燃元胞可以一次点燃周 围邻居中的所有未燃森林,具体规则如下: 如果n i,j ( t ) = 0 或 n i,j ( t ) = 3,则n i,j ( t +1 ) = n i,j ( t ) ; 如果n i,j ( t ) = 2,则n i,j ( t +1 ) = 3 ; 如果n i,j ( t ) = 1 且 n ‘ ( t ) = 2(n ‘ 为邻居元胞集合中的元素),则n i,j ( t +1 ) = 2; 否则,n i,j ( t +1 ) = 1。 这是一个对现实高度简化的林火蔓延模型,蔓延表现为由火点向四周成圆形扩散,基本 上反映了一个理想化林火蔓延过程。实际上这个模型是一个最基本的二维通用扩散模型,可 以在此基础上,加以改进、扩展,用来模拟疾病传播、污水扩散等现象。 为了更加真实的模拟林火行为过程,对上面的理想模型进行了扩展,扩展后具体模型如 下。 元胞空间:与理想模型一致,只是在应用中与数字高程模型、遥感影象等数据的分辨率 相匹配。 元胞状态:元胞的状态除表示森林燃烧状态外,还扩展了森林材质、湿度、地形坡度、 风速风向等变量。另外为了更精确描述燃烧的过程,燃烧状态又细分成三个子状态,其中 21 表示刚刚被点燃的森林, 22 表示火势旺盛的森林, 23 表示由明火转向暗火的森林(逐渐 熄灭)。由于不同材质的森林在各个燃烧阶段的持续时间不同,气温和湿度也会对燃烧阶段 的持续时间产生影影响,所以在森林着火之前,需要确定各个森林元胞一旦着火后,处于燃 烧三个子阶段的时间(可以通过 GIS 再分类命令实现) RT1, RT2, RT3。其它三个状态不 变,还是 0 代表无森林覆盖,1 代表未燃森林,3 代表已烧过的森林。 邻域定义:每个元胞以 8 个相邻元胞作为其邻域元胞。 转换规则:林火蔓延规则进行了扩展。假定只有状态为 22 的元胞,燃烧正旺的森林才 能点燃其邻域元胞;状态为 21 的元胞刚被点燃,火势较小不会点燃周围元胞;状态为 23 的元胞则由于火势减弱,也无法点燃周围元胞。具体的转换规则如下: 如果n i,j ( t ) = 0 或 n i,j ( t ) = 3,则n i,j ( t +1 ) = n i,j ( t ) ; 如果n i,j ( t ) = 21,则有 若RT i,j >RT1 i,j ,则n i,j ( t +1 ) = 22 ; 否则n i,j ( t +1 ) = 21,RT i,j = RT i,j +1; 如果n i,j ( t ) = 22,则有 若 RT i,j > RT1 i,j +RT2 i,j ,则 n i,j ( t +1 ) = 23; 否则 n i,j ( t +1 ) = 22, RT i,j = RT i,j +1; 如果 n i,j ( t ) = 23,则有 若 RT i,j >= RT1 i,j +RT2 i,j +RT3 i,j ,则 n i,j ( t +1 ) = 3; 否则 n i,j ( t +1 ) = 23, RT i,j = RT i,j +1; 如果 n i,j ( t ) = 1 且 n ‘ ( t ) = 22( n ‘ 为邻居元胞集合中的元素) , 若当前元胞被点燃的可能性超过设定的概率水平后,则 n i,j ( t +1 ) = 21, RT i,j = 0; 否则, n i,j ( t +1 ) = 1。 其中,计算森林元胞被邻域元胞点燃的可能性的计算方法是: 首先得到元胞状态为 22 的各个元胞点燃周围森林的可能性向量 P k ,如图 10-15 所示: 图 10-15:状态为 22 的元胞点燃周围森林的可能性向量图 然后计 算当 前森 林元 胞被 点燃的 可能 性是 它的 所有 相邻元 胞点 燃它 的概 率和 。 若超过 了 设定的概率水平,则可用随机数的产生方法来确定当前元胞是否被点燃。 至此, 一个 较为 精确的 林 火蔓延 的动 态模 型构 建完 成。 这 样 将 模 型 集 成 到 GIS 系统 中, 在空间 数据 库、 遥感 影象 、 数 字 高 程 模 型 等 数 据 的 支持下 , 提 取合 理的 模型 参数, 对森 林不 同地点 、不 同天 气条 件下 ,一旦 着火 后的 林火 蔓延 过程进 行动 态模 拟和 预测 ,对森 林防 火 、 火灾救险工作有很大的应用价值。 5. 4 元胞自动机与 GIS 集成应用中的局限性 1)简单性与真实性的矛盾问题 元胞自 动机 是对 现实 世界 的高度 抽象 和概 括 , 它 能 简 洁直观 地模 拟空 间复 杂系 统的动 态 演化, 但同 时人 们不 仅会 怀疑现 实系 统是 不是 这样 演化的 , 真 实性 是元 胞自 动机模 型面 临的 最大质 疑 。 问 题在于 : 元 胞自动 机只 考虑 元胞 之间 的局部 作用 , 而没考 虑元 胞空间 的宏 观作 用, 因而 忽略 了现实 系统 的宏观 作用 因素 ; 元 胞自 动机的 因素 层过 于单 一, 元胞状 态的 变 化 取决于 自身 和邻 域元 胞的 状态组 合, 从而 忽略 了其 它因素 的影 响; 标准 元胞 自动机 的转 换规 则是确 定性 的 , 而现 实系 统的行 为并 非是 确定 性的 , 往 往表 现为 某种倾 向和 可能性 。 所 以 在 实际应 用中 , 需要在 简单 性和真 实性 之间 寻找 一个 平衡点 , 避 免 模型过 于简 单, 造成 结果 的 不真实,又要防止模型过于复杂,而失去了模型本身的意义和优势。 2)空间划分问题 元胞自 动机 是建 立在 离散 、 规 则 的 空 间 划 分 基 础 上 的 , 但 如何 确定 合适 的空 间分辨 率却 是元胞 自动 机应 用的 一个 难题。 尤其 是在 多种 地理 实体共 存的 系统 中, 不同 的实体 有着 不同 的空间 尺度 , 如 何确 定一 个同一 的空 间分 辨率 , 对 于元胞 自动 机建 模更 为困 难。 另 外 , 在 不 同的空 间分 辨率 下, 地理 系统单 元所 表现 出的 规律 也有所 不同 , 因 此 , 如 何 确定适 当的 分辨 率,并进一步制定合理的模型规则是元胞自动机建模的一个难题。 3)时间对应问题 在元胞 自动 机模 型中 ,时 间是一 个抽 象的 概念 ,从 模型中 的 T 时刻 到 T+1 时 刻对应 的 时间单位不明确,而不同元胞在不同状态下持续的时间也很难确定。 4)转换规则定义问题 合理 的规 则是 模型 效果 的 关键, 在元 胞自 动机 模型 中, 规则 是针 对抽 象空 间划 分 单 元 的 , 反映了 单元 间局 部的 相互 作用。 此局 部规 则与 传统 的宏观 规律 , 既 有联 系, 又存在 差别 , 而 且找到一个确定性的规则的难度相当大。 5)与 GIS 集成的问题 GIS 系统 的支 持是 地理 系 统建模 研究 的必 要条 件, 虽 然元胞 自动 机模 型与 栅 格 GIS 在空 间数据 结构 上存 在较 大的 相似性 ,但 元胞 自动 机是 一个时 空动 态模 型, 而目 前 GIS 本质 上 是一个 静态 系统 , 支 持动 态模拟 的功 能较 弱, 二者 的集成 有一 定的 困难 。 如 何将二 者紧 密 的 集成,是阻碍元胞自动机在地理系统研究中应用的一个难题。 6.空间相互作用与位置——分配模型 6. 1 地理位置 对于生产单位和 服务企业 来说,由于需求 和供给两 方面总是存在着 空间上分 布的差异 性,因此 ,机构 设施地 理 位置(G eographic Location)的选 择和确 定对于 它 们的经济 效益 和自身的发展具有至关重要的影响作用。 机构设 施位 置评 价和 优化 , 是通过 对于 一个 设施 或者 一个设 施网 络的 供给 和需 求两者 之 间的相 互作 用关 系进 行分 析来实 现其 空间 位置 分布 模式的 优化 。 机构 设施 区位 评价是 对于 现 有服务 设施 的空 间位 置分 布模式 的评 价, 机构 设施 区位优 化是 对于 其最 佳位 置的搜 寻。 克理 斯塔勤 的中 心地 理论 则为 供给区 位优 化模 式的 理论 研究和 经验 方法 的应 用提 供了基 础框 架 , 这个理 论中 的市 场区 域规 模是由 供货 和服 务的 范围 决定的 , 需求 和供 给两 者之 间的关 系是 以 距离最 小化 和利 润最 大化 为基础 建立 的 。 但是 , 实 际应用 中的 中心 地理 论, 无论是 理论 方法 还是它 的经 验方 法都 需要 根据具 体问 题进 行具 体分 析。 例如 , 与理 论中 假设 的 聚落世 界相 反, 区域的 人口 集中 和分 散将 会对该 区域 的范 围大 小产 生影响 ; 同 样, 消 费 者 的 消 费行为 的选 择 也会对 一个 服务 中心 的功 能范围 产生 影响 。 因 此, 中 心地理 论虽 然提 供了 一个 描述和 解释 货 物服务 供给 系统 和需 求行 为两方 面空 间相 互作 用的 主要框 架体 系, 但它 作为 一个参 考框 架 , 还需要针对特殊情况进行扩充和调整。图 10-16表示了中心地理论应用的概念框架。 中心地 理论 框架 供给系 统 需求系 统 空间行 为相 互作 用 市场区 域功 能分 布 针对 特殊 情况 的扩充 和调 整 图 10-16:中心地理论应用的概念框架 中心地 理论 的古 典模 型是 对包含 单一 目标 的 、 且 内 部 需求全 部针 对这 个目 标中 心的具 有 均质性 的市 场功 能区 域进 行空间 分析 和模 拟 , 而 中 心 地理论 的现 代模 型则 要针 对现实 世界 中 那些具 有不 确定 性的 、 涉及 多目标 消费 行为 和复 杂供 给行为 的市 场功 能区 域进 行空间 分析 和 模拟。 在对于 更具 现实 性的 市场 功能行 为研 究基 础之 上 , 人 们研究 出了 许多 能够 针对 现实世 界 的市场功能区域进行空 间分析和模拟的模型, 如 Reily 的零售重力模 型( Retail Gravitation) 、 Ba tty 的 裂点方程 (Brea kpoint Equation) 、 Tob ler 的价格 场和作用 风 (Pric e Field and Interaction Wind)以 及众 多的 修正式 。但 将重 力模 型及 裂点方 程用 于 分析多 点中 心地 系统 则非 常艰难 , 由 于 缺乏可 视性 和连续 性 , 因 此 , 分 析 结 果的成 图也 很困 难。而 Tobler 方 法 是 对 中 心城市 场特 性的 一种 半定 量描述 。下 面, 将重 点介 绍有关 定位 — —配置问题解决方法中的一种空间线性优化模型。 6. 2 空间优化模式的定义 空间优 化模 式用 于解 决位 置—— 分配 问题 。 位 置— —分配 问题 , 是 在规 划重 要公共 设施 的位置 及其 附属 区域 时产 生的 ( 公 共 设施, 如医 院 、 幼儿 园、 游 戏 场 所 、 养 老院、 学校、 警 察局、消防队、急救站、管理设施等,即属于国家预算范围内的基础设施) 。 一个位置一分配问题一般可表述如下: 设有一 定数 量的居 民集 中 点,这 些点 被称为 需求 点 (或消 费点 、居民 点) , 求 一定数 量 的供给点(某种公共设施)以及(或)供给点的需求分配,以完成某个规划目的。 如果已设需求点,求供给点,则涉及位置或定位问题(Location) 。 如果已设供给点,求分配,则涉及分配或配置问题(Allocation) 。 如 果 同 时求供 给点和 分配 ,则涉 及位置 一分 配或定 位一配 置问 题 (Location-Allocation) 。 通过需求点和供给点之间的分配,供给点的附属区域也就确定了,如图 10-17所示。 图 10-17:公共设施的位置及其附属区域 (图中实心圆表示需求点,方框表示供给点, 供应点附属区域边界为简单的直线,但实际中并非如此) 优化模 式基 本结 构由 一系 列边界 条件 和一 个 ( 或 几 个 , 但 少 见 ) 目 标 函 数 组 成 。 在 这 些 边界条 件下 , 求目 标函 数的 极大值 或极 小值 。 边界 条件 代表了 规划 目标 所必 须满 足的划 条件 , 它们代 表了 对于 目标 规划 区域功 能的 基本 评价 ; 而 优化目 标函 数 (即求 目标 函数的 极值 ) 则 代表了 一个 最大 限度 可能 达到的 规划 目标 。 因 此, 在 边界条 件中 体现 出来 的关 目标函 数的 规 划条件 具有 首要 意义 , 与优 化目标 函数 相应 的规 划目 标的重 要性 则稍 差一 些引 入目标 函数 的 极大、 极小 化意 义, 在于 得到一 个定 位一 配置 问题 的明确 答案 (指 在一 定边 界条件 下, 目标 函数有数个可行答案的情况下) 。 6. 3 空间优化模式的分类 按照目 标规 划的 时间 范围 、 问 题空 间类 型、 公共 设 施服务 方式 、 路途费 用承 担者以 及公 共设施使用类型等,可以将空间优化模式进行分类,如图 11-18 所示。 空间优 化模 式分 类 动态 静态 连续 离散 集中 分布 使用者 提供者 自愿 规定 自愿 规定 相连 不相连 分类标 准 规划时 间范 围 问题空 间类 型 公共设 施服 务方 式 运输费 用承 担者 公共设 施使 用类 型 需求点 分配 类型 附属区 域 图 10-18:空间优化模式分类 6. 3. 1 规划时间范围 如果规 划是 在某 个时 间段 (点) 上解 决位 置一 分配 问题, 则采 用静 态优 化模 式。 如 果 规 划时间 范围包 括数个 时间 段(点) ,则采 用动 态优化 模式。 动态优 化模式 虽然 形式上 易于描 述, 但在 用于 解决现 实的 规划问 题时 , 由于优 化目 标的规 模过 大而 难以 实现 , 许 多问 题可 以 用静态模式加以圆满解决。 6. 3. 2 问题空间类型 如果所研究地区所有点都可能作为供给点,这就是一个连续性的问题。但在规划问题 上,可作供给点的数目一般是有限的,因此,问题的解决可用离散模式。 规划时间范围及问题空间类型这二个维度非常重要,因为与它们相应的模式类型在形 式结构的复杂性、问题解决的可能性和模式的可操作性上差别很大。下面将重点讨论“静 态一离 散空 间优 化模 式” , 该模式 按照 具体 规划 问题 中所遇 到的 设施 类型 还可 以再进 行细 分 。 6. 3. 3 公共设施服务方式 如果公共设施只限于在某个确定地点为需求者提供服务,例如学校、幼儿园、养老院、 医院、派出所等,需求者必须亲自前去这些公共设施接受服务,则称这些公共设施的服务方 式为“集中式”。 如果公共设施所能提供的服务必须从供给点通过某种运输手段带给需求者,例如消防 队、医疗急救中心、警察局等,则称这些公共设施的服务方式为“分布式”。 6. 3. 4 运输费用承担者 当公共设施的服务方式为“集中式”时,需求者一般直接负担自己前去这些公共设施接 受服务的路途费用;当公共设施的服务方式为“分布式”时,需求者为接受服务所支付的费 用一般与路途距离无关。 在“集中式”的位置——分配系统中,服务供给点的可接近程度必须从社会公正和机会 均等的观点出发,而在“分布式”的位置——分配系统中工作效率问题的考虑更为重要。 6. 3. 5 公共设施的使用类型 一些公共设施如小学、医院、政府管理机构等,它们基于相应的法律如小学九年制义务 教育、户籍管理制度等以及不可避免的客观事实如看病就医等,对于需求者具有强制性使用 的性质。这种类型的公共设施由于不存在着竞争意义上的对手,因此,它们将来的需求以及 设施规模都是可以预测的,称这类公共设施为规定性使用类型。 另外一些公共设施如商厦、饭店、宾馆、公园、体育馆等社会基础设施,属于需求自愿 使用的设施类型。这类设施的供给与需求矛盾可能会变的非常突出,因此,它们将来的需求 以及设施的规模难以预测,它们的需求者经常根据运输费用的变化而发生变化。这类设施定 位时,优先考虑选择居民数量增加潜力较大的地点。 6. 3. 6 需求点的分配类型 和公共设施的使用类型一样,需求点的分配类型也可以是自愿或规定的。在“分布式” 的位置一分配系统中,需求点的分配类型属于规定型,属于公共设施的由需求点组成的附属 区域一般是确定的(既使需求者是出于自愿的);在“集中式”的位置一分配系统中,需求 点的分配类型属于自愿型,属于公共设施的由需求点组成的附属区域一般是不确定的。 比较困难的是,在需求点自愿分配的情况下估计各个供给点的附属区域及公共设施设置 的规模。如何将使用者分配至供给点,可以用生产和吸引力有限的空间作用模式大概估算出 来。 6. 3. 7 附属区域类型 需求点的规定分配与不相连的附属区域相对应,需求点的自愿分配与相连的附属区域相 对应。 6. 4 静态——离散空间优化模式的数学表达:线性规划 有关静态——离散的定位——配置问题是在规划重要公共设施的位置及其附属区域时 出现的。静态——离散的位置——配置问题须考虑很多潜在的供给点,并且位置和附属区域 的确定将在长时间内处于不变的状态。 在空间优化过程中,如果目标函数和边界条件都是线性的,则采用的数学工具是线性规 划 * ( Linear Programming)。所谓线性规划,是指在一组线性的等式和不等式的约束下,求 一个线性函数的最大值或最小值的问题。 线性规划的一般形式为:: 目标: min c 1 x 1 + c 2 x 2 +… …+ c n x n 约束条件: a 11 x 1 + c 12 x 2 +… …+ c 1n x n ≤ c 1 … … a m1 x 1 + c m2 x 2 +… …+ c mn x n ≤ c 1 x 1, x 2… … x n ≥0 下面一个例子属于产销区划,就可以用线性规划解决,有 A、 B、 C 三个产地,产量分 别为 50、 30、 20,对应销地 I、 II、 III,需要量分别为 40、 40、 20。首先通过最短路径分析, 得到如表 10-6 描述的运费。 表 10-6:资源分配的运费表(∞表示不连通) I II III A 2 3 5 B ∞ 1.5 8 C 2 4 ∞ 问题是:如何确定其供应关系,使得总运费最少。假定 x 11 表示从A 到 I的运量,x 12 表示从A 到II的运量,依次类推。则问题可以描述为: Object: min 2x 11 +3x 12 +5x 13 +1.5x 22 +8x 23 +2x 31 +4x 32 Constraint: x 11 + x 12 +x 13 =50 x 22 +x 23 =30 x 31 +x 32 =20 x 11 +x 31 =40 x 12 +x 22 +x 32 =40 x 13 +x 23 =20 x 11, x 12, x 13, x 22, x 23, x 31, x 32 ≥0 目前已经有许多成熟的解决线性规划的方案,如图解法、单纯形法等等。上述供销区划 的答案如表 10-7 所示,总运费为 255。 表 10-7:资源分配的运量 I II III A 20 10 20 B 0 30 0 C 20 0 0 * 严格的说,线性规划已经不属于GIS 功能的范畴,不过许多GIS 软件提供此功能以实现资源分配。 基因算法(Genetic Algorithm ): 基因算法是最近提出的用于解决优化问题的方法,它通过对一个集合的变量值进行优 化,得到可以定量描述优劣的目标。量化描述目标合适程度的思路来自于达尔文的进化论, 在进化过程中,不同代生物染色体的基因的内容和形式都在发生变化,使得生物更能够适合 于生存环境。在基因算法中,是通过不同方式的组合以及修改数值以改变变量,这类似于生 物的配对和变异。通过比较合适指标,测试改变变量后的计算结果,保留“有利的”组合, 并进行进一步的修改。一种理想的结果是:保留下来的改变优于其它的组合和改变,通过不 断的迭代过程,可以使得一个优化的结果。基因算法的成败依赖于以何种方式来模拟各种形 式的染色体,并使其不断进化,以增加它在最优解中的存活几率。存活下来的染色体一般都 对应于一个局部极值,而后者可以导致全局的最优解。 在一个基因算法中,要确定的内容包括: 1)基因操作,如配对和变异; 2)策略性的参数:如配对和变异发生的几率; 3)表现模式:如对基因的编码等等。 在 GIS 中,基因算法可以应用于空间相互作用(Spatial Interaction )建模,后者可以应 用于公共设施,如商店、医院等的区位。 上北下南,绿色代表平原,棕色代表高山,蓝色代表海洋。 布拉格是粉红色的,佛罗伦萨是蓝色的。 地图是一个令人想入非非的东西,它的容量如此之大,足够存储我们过于丰富的 情感。 佚名 第十一章 空间数据表现与地图制图 导读:空间数据的表现功能贯穿于GIS空间数据处理的始终,功能的许多方面,包 括符号、专题信息表达、图幅配置、制图综合等,都来源于地图制图,这也表明了 地理信息系统和制图学的渊源关系。从某种角度上来讲,地理信息系统可以称为“动 态的地图”,它提供了比普通地图更为丰富和灵活的空间数据表现方式,如动态信息 表达、虚拟现实等等。但是,从另外的角度来看,制图学又是一门艺术,单纯依靠 计算机系统是难以制作完美的地图的,它需要人工的交互干预,如制图综合,目前 还没有任何GIS软件能够很好地解决这些问题。 本章最后介绍了可视化的内容,可视化与信息的感知和传输有着密切的关系,地学 可视化的研究、以及在GIS中应用可视化技术,对于空间数据的广泛应用有着重要 的意义。 1.概述——地理信息系统数据表现与地图学 地图是记录地理信息的一种图形语言形式,从历史发展的角度来看,地理信息系统脱胎 于地图,并成为地图信息的又一种新的载体形式,它具有存储、分析、显示和传输的功能, 尤其是计算机制图为地图特征的数字表达、操作和显示提供了成套方法,为地理信息系统的 图形输出设计提供了技术支持;同时,地图仍是目前地理信息系统的重要数据来源之一。但 二者又有本质之区别:地图强调的是数据分析、符号化与显示,而地理信息系统更注重于信 息分析。地图学理论与方法对地理信息系统的发展有着重要的影响,特别是地理信息系统中 的空间数据表现许多技术来源于地图学,但是,其表现手段更加灵活和丰富。 计算机制图是地图学中较新的一个领域,也是地理信息系统输出、显示结果的一个重要 部分。计算机制图的主要内容是将地图设计和绘制通过计算机程序和相应的绘图硬件来实 现。地图符号已经可以完全由计算机绘制。对地图特征的许多处理,如分类、空间插值等均 可用计算机来实现。利用计算机对线状要素进行制图综合也已经取得很大进步。但是,利用 计算机进行制图综合的结果仍比较机械,需要将更多的专家经验计算机化,特别是用计算机 同时对多种内容进行地图综合还不太成熟。计算机图形学是利用计算机处理图形信息以及借 助图形信息进行人——机通讯处理的技术,是 GIS 算法设计的基础, GIS 是随着计算机图形 学技术的发展而不断发展完善的。 1. 1 构成地图学与地理信息系统的数学法则 地图对它所表现的地面上的景物,应能按比例尺衡量。比例尺是地图上直线长度与地面 上相应距离的水平投影长度之比。如地图上注有比例尺 1: 50000,表示图上地物的长度相 当于相应地面地物长度的 1/50000。这个尺度对大比例尺地图来说,基本上适合图上各个部 分。因此,可以认为,比例尺是地图线形缩小程度的标志,它是构成地图数学要素的基本组 成部分之一。地图上各种地物之间的关系,要求按数学法则构成,这就是先将地球自然表面 的景物垂直投影到地球椭球面(或球面)上,再将地球椭球面(或球面)按数学法则投影到 平面上而构成地图。这种按数学法则将地球椭球面(或球面)转绘到平面上的方法,叫地图 投影。按这种方法建立的数学基础,才能使地球表面上各点和地图平面上的相应各点保持一 定的函数关系,从而才能在地图上准确地表达空间各要素的关系和分布规律,才可能反映出 它们之间的方向、距离和面积,使地图具有区域性和可量测性。 1. 2 地图学和地理信息系统的符号 地图符号是表达地图内容的基本手段,它不仅能表示事物的空间位置、形状、质量和数 量特征,而且还可以表示各事物之间的相互联系及区域总体特征。图形符号是由形状、尺寸 和颜色三个基本因素所组成,具有系统化的特点;注记是地图符号的一个重要部分,它也有 形状、尺寸和颜色的区别。根据事物分布的特点,地图符号有面状、点状和线状之分。这些 符号运用在表示专题要素的分布、质量和数量特征以及动态变化时,形成了许多表示法:范 围法、质底法、量底法、等值线法、定点符号法、线状符号法、动线法、点值法、定域统计 图法、色级统计图法以及定位统计图法。表示地形的主要方法有等高线法、分层设色法、晕 渲法等。 地图符号是表示地图内容的基本手段,它由形状不同、大小不一、色彩有别的图形和文 字组成。地图符号是地图的语言,是一种图形语言。它与文字语言相比较,最大的特点是形 象直观。就单个符号而言,它可以表示某个事物的空间位置、大小、质量和数量特征;就同 类符号而言,可以反映各类要素的分布特点;而各类符号的总和,则可以表明各类要素之间 的相互关系及区域总体特征。因此,地图符号不仅具有确定客观事物空间位置、分布特点以 及质量和数量特征的基本功能,而且还具有相互联系和共同表达地理环境各要素总体的特殊 功能。 地图符号的形成过程,可以说是一种约定的过程,经过很长时间的检验,有约定而达到 俗成的程度,为广大用图者所熟悉和承认。地图符号的作用,在于它能保证所表示的客观事 物空间位置具有较高的几何精度,从而提供了可测量性;能用不依据比例符号或半依据比例 符号表示出事物的质量和数量特征。 地图是运用易被人们感受的图形符号表示地面景物的,使用符号具有以下功效: 1)有选择地表示地理环境中的主要事物,因而在较小比例尺的地图上所表现的地面情 况,仍能一目了然,重点突出。对于那些由于缩小而不能按比例尺表示的重要地面景物,可 用不依比例的符号夸大表示; 2)用平面的图形符号表示地面的起伏状况,也可以说是在二维平面上,能够表达出三 维空间状况,而且可以量测其长度、高度和坡度等; 3)除了用符号表示出地面景物的外形,还能表示出景物的看不见的本质特征,如在海 图上可以表示出海底地形、海底地质、海水的温度和含盐度等; 4)用符号可以表示出地面没有外形的许多自然和社会经济现象,如气压、雨量、政区 和人口移动等。此外还可以表现出事物间的联系和制约关系,如森林分布和木材加工工业之 间的联系。地图上还有起说明作用的文字和数字,它们也是地图的重要组成部分,用以标明 地面景物的名称、质量和数量。 1. 3 地图学和地理信息系统的制图综合 制图综合是对制图区域客观事物的取舍和简化。经过概括后的地图可以显示出主要的事 物和本质的特征。地图的比例尺、用途和主题,制图区域的地理特征以及符号的图形尺寸是 影响地图概括的主要因素,地图概括主要表现在内容的取舍、数量简化、质量化简和形状化 简等方面。 地图最重要、最基本的特征是以缩小的形式表达地面事物的空间结构,这个特征表明, 地图不可能把地面全部事物毫无遗漏地表示出来。地图上所表示的地面状况是经过概括后的 结果。地图和实际地面相比,是缩小的。地图上所表现的地面景物,从数量上看是少的,从 图形上看是小了、简化了。这是因为地图上所表现的内容都是经过取舍和化简的。由 1: 10000 比例尺缩小到 1:50000 比例尺的地图,对原来的内容如不进行取舍和化简,缩小后的地图 既不清楚又不易读。这种把实地景物缩小或把原来较详细的地图缩成更小比例尺地图时,根 据地图用途或主题的需要,对实况或原图内容进行取舍和化简,以便在有限的图面上表达出 制图区域的基本特征和地理要素的主要特点的理论与方法,称为地图综合(地图概括) 。制 图综合就是对客观事物进行取舍和化简,取舍就是从大量的客观事物中选出最重要的事物表 示在图上,而舍去次要的事物;化简就是对客观事物的形状、数量和质量特征的化简;形状 化简是去掉轮廓形状的碎部,以突出事物的总体特征;数量和质量特征的化简就是减少分类 和分级的数量,以缩小与客观事物的差别。当然取舍和化简不是任意的,而是根据地图的比 例尺、用途和制图区域的地理特征,对地图上各要素及其内在联系加以分析研究,选取的目 的是强调主要的事物和本质的特征,而舍去次要的事物和非本质的特征。制图综合可分为比 例概括和目的概括。前者是由于地图比例尺缩小,图形也就缩小,有些图形缩小到难以清楚 地表达出来,从而必须选取和化简;后者是因为客观事物的重要性并不完全决定于它的图形 大小,故而它的选取和化简也不完全由比例尺决定,还要根据编图者对客观事物重要性的判 断来确定是否选取和化简。 从地理信息系统的发展过程可以看出,地理信息系统的产生、发展与制图信息系统存在 着密切的联系,两者的相通之处是基于空间数据库的表达、显示和处理。从系统构成与功能 上看,一个地理信息系统具有机助制图系统的所有组成和功能,并且地理信息系统还有数据 处理的功能。地图是一种图解图像,是根据地理思想对现实世界进行科学抽象和符号表示的 一种地理模型,是地理思维的产物,也是实体世界地理信息的高效载体,地图可以从不同方 面、不同专题,系统地记录和传输实体世界历史的、现在的和规划预测的地理景观信息。 2.地图的符号 2. 1 地图符号的实质 2. 1. 1 概念 地图符号(Symbol )是地图的语言,它是表达地图内容的基本手段。地图符号是由形 状不同、大小不一和色彩有别的图形和文字组成,注记是地图符号的一个重要部分,它也有 形状、尺寸和颜色之区别。就单个符号而言,它可以表示事物的空间位置、大小、质量和数 量特征 ; 就 同类 符号 而言 , 可 以 反 映 各 类 要 素 的 分 布特点 ; 而 各类 符号 的总 和, 则 可 以 表 明 各要素之间的相互关系及区域总体特征。 地图符 号可 以指 出目 标种 类 ( 如公 路) 及其 数量 特 征和质 量特 征 (如公 路行 车部分 的铺 面种类和宽度) ,并且可以确定对象的空间位置和现象的分布(如人口密度等) 。 2. 1. 2 分类 1)按照符号的定位情况分类 可以将符号分为定位符号和说明符号。 定位符 号是 指图 上有 确定 位置, 一般 不能 任意 移动 的符号 ,如 河流 、居 民地 及边界 等 , 地图上的符号大部分都属于这一类; 说明符 号是 指为 了说 明事 物的质 量和 数量 特征 而附 加的一 类符 号 , 它通 常是 依附 于 定 位 符号而 存在 的 , 如说 明森 林树种 的符 号等 。 它 们在 图上配 置于 地类 界范 围内 , 但 都没 有定 位 意义。 2)按照符号所代表的客观事物分布状况分类 可以把符号分为面状符号、点状符号和线状符号。 面状符 号是 一种 能按 地图 比例尺 表示 出事 物分 布范 围的符 号。 面状 符号 是用 轮廓线 (实 线、 虚 线 或 点 线 ) 表 示 事 物的分 布范 围, 其形 状与 事物的 平面 图形 相似 , 轮 廓线内 加绘 颜色 或说明 符号 以表 示它 的性 质和数 量 , 并 可以从 图上 量测其 长度 、 宽度和 面积 , 一 般又 把这 种 符号称为依比例符号(图 11-1) 。 图 11-1:面状符号 点状符 号是 一种 表达 不能 依比例 尺表 示的 小面 积事 物(如 油库 等) 和点 状( 如控制 点 ) 所采用 的符 号。 点状 符号 的形状 和颜 色表 示事 物的 性质, 点状 符号 的大 小通 常反映 事物 的等 级或数 量特 征 , 但是 符号 的大小 与形 状与 地图 比例 尺无关 , 它 只 具有定 位意 义, 一般 又称 这 种符号为不依比例尺符号(图 11-2) 。 图 11-2:点符号 线状符 号是 一种 表达 呈线 状或带 状延 伸分 布事 物的 符号, 如河 流, 其 长 度 能 按 比例尺 表 示, 而 宽 度 一 般 不 能 按 比 例尺表 示, 需要 进行 适当 的夸大 。 因 而, 线状 符号 的形状 和颜 色表 示事物 的质 量特 征, 其宽 度往往 反映 事物 的等 级或 数值。 这类 符号 能表 示事 物的分 布位 置 、 延伸形态和长度,但不能表示其宽度,一般又称为半依比例符号(图 11-3) 。 图 11-3:线状符号 2. 2 地图符号的构成特点 2. 2. 1 符号的构成要素 地图上的形状、尺寸和颜色是构成符号的三个基本要素。 1)符号的形状 符号的 形状 主要 是表 示事 物的外 形和 特征 , 面状 符号 的形状 是由 它所 表示 的事 物平面 图 形 决 定的, 点 状 符 号 的 形 状 往往与 事物 外部 特征 相联 系, 线状 符号 的形 状是 各种 形式的 线划 , 如单线、双线。 2)符号尺寸 符号尺 寸大 小和 地图 内容 、 用途、 比例 尺、 目视 分辨 能力、 绘图 与印 刷能 力等 都有关 系, 不同的比例尺的地图,其符号大小也有所不同。 3)符号的颜色 符号的 颜色 可以 增强 地图 各要素 分类 、 分级的 概念 , 简 化符 号的 形状差 别 , 减少符 号数 量,提高地图的表现力。使用颜色主要用以反映事物的质量特征、数量特征和等级。 2. 2. 2 地图符号的系统化 由形状 、 尺 寸 和颜色 变化 组成的 各种 地图 符号 并不 是孤立 的 , 它 们具有 内在 的联系 。 通 过符号的变化可以把地图内容的分类、分级、重要、次要等不同情况表达出来。 2. 2. 3 地图符号的感受效果 地图是 由在 不同 位置 上的 符号图 形所 组成 的, 符号 的复杂 排列 能引 起视 觉的 不同感 受 。 读图时 可获 得整 体感 、 差 异感 、 立 体感 等不同 的感 受效果 。 整 体 感主要 依靠 符号之 间不 存 在 明显的 差异 而形 成的 ; 差 异感是 由不 同组 成要 素在 图形间 产生 明显 区别 而形 成的; 立体 感主 要是利 用透 视的 方法 , 通 过改变 符号 的尺 寸、 颜色 的亮度 等来 实现 的, 如晕 渲法就 是利 用 光 影,模拟地表面受光的强弱,用浓淡不同的色调显示地形起伏而产生立体感。 地图符 号使 用了 不同 的视 觉变量 , 如 尺 寸 、 形 状、 灰度、 纹 理 、 方向和 颜色 等, 实现 了 不同的感受效果。 (图 11-4) 图 11-4:地图符号效果 2. 3 地图上的注记 2. 3. 1 地图注记的种类 地图上 的文 字和 数字 总称 为地图 注记 , 它 是地 图内 容的重 要部 分。 注记 并不 是自然 界中 的一种 要素 ,但 它们 与地 图上表 示的 要素 有关 ,没 有注记 的地 图只 能表 达事 物的空 间概 念 , 而不能 表示 事物 的名 称和 某些质 量和 数量 特征 。 地 图上的 注记 可分 为名 称注 记、 说 明 注 记 和 数字注记三种。 1)名称注记 说明各种事物的专有名称,如居民点名称; 2) 说明注记 用来 说明 各 种事物 的种 类、 性质 或特 征, 用 于 补 充 图 形 符 号 的 不足, 它常 用简注表示; 3)数字注记 用来说明某些事物的数量特征,如高程等。 2. 3. 2 注记的字体、字级和颜色 地图上 常用 不同 的字 体表 示不同 的事 物, 常用 的字 体 有宋体 、 等 线体、 仿宋 体和 横线体 ; 地图上 注记 尺寸 的大 小, 以照相 排字 机注 明的 规格 为标准 , 在 一 幅图上 , 按 照事物 的重 要程 度和意 义 , 采 用不同 的字 级, 以便 使注 记大小 与图 形符号 相对 应 ; 注记 的颜 色只有 色相 的 变 化,颜色的选用要与注记所表示的事物类别相联系。 2. 3. 3 注记的排列和配置 地图上 注记 数量 较多 , 它 们可以 位于 地图 中的 任一 部分, 但是 注记 的排 列和 配置是 否恰 当, 常 常 会 影 响 读 图 的 效 果 。 汉 字注 记通 常有 水平 字列、 垂直 字列 、 雁 形字 列 ( 注 记 的 字 向 指向北 方或 图廓 上方 ) 和 屈曲字 列 ( 注记 的字 向与 注记文 字中 心线 垂直 或平 行) 等 等 。 注 记 配置的 基本 原则 是不 应该 使注记 压盖 图上 的重 要部 分。注 记应 与其 所说 明的 事物关 系明 确 。 对于点 状地 物, 应以 点状 符号为 中心 ,在 其上 下左 右四个 方向 中的 任一 适当 位置配 置注 记 , 注记呈 水平 方向 排列 ;对 于线状 事物 ,注 记沿 线状 符号延 伸方 向从 左向 右或 从上向 下排 列 , 字的间 隔均 匀一 致, 特别 长的线 状地 物, 名称 注记 可重复 出现 ; 对 于面 状事 物, 注 记 一 般 置 于面状符号之内,沿面状符号最大延伸方向配置,字的间隔均匀一致。 图 11-5 表示了点、线、面注记的不同配置方式。 图 11-5:几种可能的注记配置方式 为了确 定地 物注 记的 位置 ,要进 行空 间关 系的 判断 ,因此 GIS 可以 为地 图制 图提供 自 动标注功能,一个实现自动注记放置的系统要具有以下功能: 1)确定地图上的要素以及相应的注记文字; 2)对空间数据进行搜索和实现; 3)产生试验性的注记点; 4)选择较好的注记位置。 由于注 记只 是对 地物 的描 述, 因此 在地 图上 , 注 记 不能遮 盖地 物 , 注记 之间 也不能 相互 重叠, 所以 ,也 可以 利用 GIS 进行注 记是 否重 叠的 判断。 在进 行注 记时 ,由 于图面 荷载 的 原因 , 不 可能 对所有 的地 物进行 标注 , 这需要 进行 选择 , 通 常的 选择方 法是 选择相 对重 要 的 地物,这也可以通过对地物属性的排序来实现。 3.专题信息表现 在大多 数地 理信 息系 统中 , 管 理 的 空 间 数 据 是 矢 量 格式的 地物 对象 , 这 些地 物对象 不仅 具有空 间位 置特 征, 而且 具有非 空间 的属 性数 据。 在表现 这些 地物 对象 时, 除了显 示空 间 位 置以外,同时还可以以特定的方式显示某个或多个相关的属性,生成专题地图。 专题地 图除 了采 用普 通地 图某些 表示 方法 并使 其得 到进一 步发 展外 , 本身 还需 要有专 门 反映各 种要 素性 质、 数量 、 空 间分 布和 时间变 化的 表示方 法 , 以 便使读 者明 确对专 题内 容 要 素的科学分析。 在专题地图中,各种制图对象的基本形状是由点、线、面及其过渡形态组成的,并以此 反映现象的分布特点、现象的变化时刻、质量和数量的特征及综合特征。因此,在选择表示 方法时,既可以根据专题制图对象的分布方式进行选择(表 11-1),也可以按它们的分布特 点进行选择(表 11-2)。 表 11-1:按照专题制图对象的分布方式选择符号 分布方式 表示分布范围 表示类别 表示数量 表示动态 点 定位符号 符号形式: 几何符号 文字符号 象形符号 符号颜色 符号大小(用深浅不同 的颜色表示主次) 数字注记 定点扩展法 定位图表法 线 线状符号 线的形式 线颜色 线条粗细,长短,附加 不同数目的小短线 动线法 面 面状符号 (范围法) 质底法 点值线法,分级统计图 法,图形统计图法,等 值线法和分层设色法 表示扩展的范 围法,扩展图 形的图形统计 图法 表 11-2:按照专题制图对象的分布特点选择符号 分布特征 状况 表示方法 固定一点 一定瞬间的状态移动 空间变化 符号法、运动线法 符号法、定位图表法 固定一线 一定瞬间的状态移动 空间变化 线状符号法、线状符号和运动符号结合 线状符号法重叠 固定面积 一定瞬间的状态移动 空间变化 质底法、等值线法、定位图表总和、范围法、区划 法结合等值线法、运动符号 等值线法、定位图表和符号总和 散布 一定瞬间的状态移动 空间变化 点子法、质底法、区划法、图表统计法和色彩统计 法、区划搭配运动符号 点子法和区划法结合、图表统计法和色彩统计法 连续分布 一定瞬间的状态移动 空间变化 质底法、等值线法、定位图表总和、地形塑拟表示 运动符号 等值线法、定位图表总和 3. 1 专题地图的分类和内容 3. 1. 1 专题地图含义 专题地图是突出地表示一种或几种自然现象和社会经济现象的地图。 按内容可分为三大 类:自然地图、社会经济地图和其他专题地图。 自然地图表示自然界各种现象的特征、地理分布及其相互关系,如地质图、水文图等; 社会经济地图表示各种社会经济现象的特征、地理分布及其相互关系,如人口图、行政区划 图等;其他专题地图,指不属于上述二类的专题地图,如航海图、航空图等。 3. 1. 2 专题地图的内容 专题地 图的 种类 很多 , 但 大都是 由地 理基 础和 专题 内容组 成的 。 地 理基 础即 普通地 图 上 的一部 分内 容要 素, 如 经 纬网、 水系、 居民点 、 交 通线、 地 势 等 。 地理 基础 作为编 绘专 题内 容的骨 架, 并表 示专 题内 容的地 理位 置和 说明 专题 内容与 地理 环境 的关 系。 专题地 图上 表示 哪些地理基础要素和详细程度如何,是根据专题内容的不同而有所不同。 专题内 容, 从资 料来 讲, 一 是将普 通地 图内 容中 一种 或几种 要素 显示 得比 较完 备和详 细, 而将其 他要 素放 到次 要地 位或省 略, 如交 通图 等; 二 是包括 在普 通地 图上 没有 的和地 面上 看 不见的或不能直接测量的专题要素,如人口密度图。 3. 2 面状专题内容的表示方法 地面上 真正 的点 状事 物很 少, 一 般 都 占 有 一 定 的 面 积 , 只 是大 小不 同。 点状 分布要 素 指 那些占 据的 面积 较小 , 不 能按比 例尺 表示 , 又 要定 位的事 物 。 对 于点状 分布 要素的 质量 特 征 和数量特征,可以用点状符号表示。 在地面 上呈 线状 或带 状分 布的事 物很 多, 如交 通线 、 河 流 及 边 界 线 等 , 对 于 这些事 物 的 分布质量特征和数量特征可以用线状符号表示。 面状专 题内 容的 表示 方法 , 最 常用 的有 : 等 值线 法 、 质底法 、 范 围 法 、 点 值 法 、 符号法 、 动线法、统计图法等。 3. 2. 1 等值线法 等值线 系指 在地 图上 通过 表示一 种现 象的 数量 指标 的一些 等值 点的 曲线 , 如 等高线 、 等 温线。 等值 线法 宜用 于表 示地面 上连 续分 布而 逐渐 变化的 现象 , 并 说明 这种 现象在 地图 上任 一点的 数值 或强 度。 等值 线的数 值间 隔原 则上 最好 是一个 常数 , 以 便判 断现 象变化 的急 剧或 和缓, 但也 有例 外。 等值 线间隔 的大 小首 先决 定于 现象的 数值 变化 范围 , 变 化范围 越大 (以 等高线 为例, 地貌高 程变 化越大) ,间隔 也越 大,反 之亦然 。如果 根据等 值线 分层设 色,颜 色应由浅色逐渐加深,或由寒色逐渐过渡到暖色,这样 可以提高地图的表现力(图 11-6) 。 图 11-6:等值线 3. 2. 2 质底法 质底法又名底色法,用于将区域划分为质量相同的地段。见图 11-7。 图 11-7:质底法示例 由于质 底法 广泛 应用 各种 颜色, 所以 有时 称之 为底 色法。 首先 按现 象的 性质 进行分 类 或 分区 , 制 成图 例, 在地 图 上绘出 各分 类界 线, 然后 把同类 现象 或属 于同 一区 划的现 象绘 成同 一颜色 或同一 的晕纹 。这 种方法 可以用 于表示 地表 面上的 连续面 状现象 (如 气象现 象) 、大 面积分 布的现 象(如 土壤 覆盖) 或大量 分布的 现象 (如人 口) 。质 底法 的优点 是鲜明 美观, 缺点是 不易 表示 各类 现象 的逐渐 过渡 , 而且当 分类 很多时 , 图 例 比较复 杂 , 必须详 细阅 读图 例时才 能读 图。 注意 质底 的 两种颜 色系 统不 应该 相互 重叠, 但是 底色 可以 与晕 线 重合。 另外, 质底法易于与其他表示方法结合使用。 3. 2. 3 范围法 范围法 又名 区域 法 , 用 于 表 示某种 现象 在一 定范 围内 的分布 。 范围 法分 为精 确范 围法 (见 图 11-8-1)和概 略范 围法 (见 图 11-8-2) ,前者 有明 确的界 线, 可以 在界 线内 着色或 填绘 晕 纹或文 字注 记; 后者 可用 虚线、 点线 表示 轮廓 界线 , 或 不 绘 轮 廓 界 线 , 只 以 文字或 单个 符号 表示现象分布的概略范围。 在地图上表示范围可以采 用各种不同的方法:用一 定图形的实线或虚线表示 区域的范 围; 用不 同颜 色普染 区域 ; 在 不同 区域 范围内 绘以 不同晕 线 ; 在 区域范 围内 均匀配 置晕 线 符 号,有时不绘出境界线;在区域范围内加注说明注记或采用填充符号。 范围法 与质 底法 的区 别, 在于所 表现 的现 象不 布满 整个编 图区 域; 不一 定有 精确的 范 围 界线。 图 11-8: ( a)精确范围法, ( b)概略范围法 3. 2. 4 点值法 点值法 是在 图上 用小 点表 示现象 的分 布和 数量 , 它 适用于 表示 分布 不均 匀的 现象。 从 图 上点的 疏密 就可 看出 现象 的集中 或分 散的 程度 。 布 点时要 确定 点的 大小 及其 代表的 值, 在最 稠密的 地方 ,点 可以 近于 紧接但 不能 重迭 ,在 最稀 疏的地 方, 也有 点的 表示 ;在其 他地 方 , 则依比例显示出点的疏密。 (图 11-9) 图 11-9:点值法示例 点值法 是质 底法 和范 围法 的进一 步发 展 。 质 底 法 和 范 围法只 能反 映现 象的 分布 范围及 其 质量特 征, 点值 法则 可以 表 明现象 的分 布和 数量 特征 。 点值法 有两 种方 法: 一是 均 匀布点 法, 即在一定的区划单位内均匀地布点;另一是定位布点法,即按照现象实际所在地布点。 点值法 的优 点是 简单 明了 , 如 果 恰 当 地 采 用 不 同 颜 色和不 同形 状的 点, 既可 以表示 现象 的数量特征,也可以表示它的质量特征和发展概况。 3. 2. 5 符号法 符号法 就是 用各 种不 同形 状、 大 小 和 颜 色 的 符 号 表 示 现象的 分布 及其 数量 特征 和质量 特 征。 通常 以符 号的大 小表 示数量 的差 别 , 形状 和颜 色表示 质量 的差 别, 而将 符号绘 在现 象 所 在的位置上。符号法可分为个体符号法和和线状符号法。 1)个体符号法 是地图 表示 法中 的一 种特 殊方法 , 用 于 表 示 不 依 地 图 比例尺 或所 占面 积小 于地 图符号 本 身的一 些地 物的 位置 , 并 且通常 用于 表示 按点 定位 的现象 。 单 个符 号按 其形 状可分 为几 何符 号、文 字符 号和 象形 符号 。由于 文字 符号 和象 形符 号不能 精确 地表 示位 置以 及数量 的差 异 , 所以地 图上 应用 最广 的是 几何符 号 。 几 何符号 具有 简单的 集合 图形 , 这 种符 号便于 绘制 , 能 准确地 指明 地物 位置 , 便 于比较 大小 ; 文 字符 号用 表示现 象名 称的 头一 、 二 个字母 代表 。 文 字符号 的应 用受 到一 定限 制, 因为 采用 字母使 地图 不易阅 读 , 不 能指示 地物 的准确 位置 , 不 能按符 号大 小对 比; 象形 符号相 似于 所表 示对 象的 图形, 可以 进一 步分 为象 征符号 和实 体符 号。前者的形状与所表示地物有某种程度的联系;后者用实体图形表示相应的事物分布。 2)线状符号法 线状符 号既 可用 于表 示几 何概念 的线 划, 如分 水岭 、 地 面 上 确 定 的 各 种 境 界 线 (如 国 界 线) ,又 可以用 于表 示线状 分布的 不能依 地图比 例尺 表示其 宽度的 地物, 如河 流与道 路等。 有时还 可以 用线 状符 号强 调图上 按面 积表 示的 地物 的主要 方向 ,如 山脊 线、 山脉走 向线 等 。 (图 11-10) 图 11-10:线状符号法示例(地质构造线) 3. 2. 6 动线法 动线法 一般 是用 箭形 符号 表示现 象的 运动 路线 和方 向, 如 人 口 迁 移 路线、 洋流 和货运 路 线等 。 箭 头和 箭体上 部的 方向应 保持 一致 , 箭 头的 两翼应 保持 对称 。 箭 形的 粗细或 宽度 表 示 洋流的 速度 强度 或货 运的 数量 ; 箭 形的 长短表 示风 向、 洋流 的稳 定性 ; 首 尾 衔接的 箭形 表示 运动的路线,动线法表示面状事物的移动。 3. 2. 7 统计图法 统计图法一般根据编图区 域内各区划单位或典型地 点的统计资料,用地图形 式表达出 来。可以分为图形统计图法、分级统计图法和定位统计图法三种。 1)图形统计图法 图形统 计图 法是 根据 各区 划单位 的统 计资 料作 成图 形或图 表, 绘在 地图 上该 区 划单位 之 内。 这 种 方 法 与 符 号 法 的 区别是 , 它 反映 一个 区划 范围的 现象 , 而 不是 一个 点上的 现象 。 图 形统计图宜于表示绝对的数量指标。 在地图 制图 中采 用较 多的 是: 线 状 统 计 图 形 — — 柱 状和带 状等 , 其 长度 与所 比较的 数 值 成正比 ; 面 积统 计图 形— —正方 形、 圆圈 等, 其面 积大小 与所 比较 的数 值成 正比; 立体 统计 图形——立方体、圆球等,其体积与所比较的数值成正比(图 11-11) 。 2)分级统计图法 分级统 计图 法表 示一 定区 域单位 范围 内某 种制 图现 象平均 密度 的方 法 。 分 级 统 计图法 是 按照各 区划 单位 的统 计资 料, 根据 现象 的密度 、 强 度或发 展水 平划 分等 级, 然后依 据级 别高 低, 在 地 图 上 按 区 划 分 别 填绘深 浅不 同的 颜色 或疏 密不同 的晕 线, 以显 示各 区划单 位间 的差 异。 分 级 时 可 采 用 等 差 的 、 等比 的、 逐渐 增大 的或 任意的 。 分 级统 计图 适于 表示相 对的 数量 指标。该种统计图法的优点在于绘制简单,阅读容易。 3)定位统计图法 定位统 计图 法是 将固 定地 点的统 计资 料, 用图 表形 式绘在 地图 上的 相应 地点 , 以 表 示 该 地某种现象的变化。常用的图表有柱状图表、曲线图表、玫瑰图表等。 图 11-11:统计图法示例 3. 2. 8 DEM 表示法 数字高程是一组关于 地表 面位置布局的高程量 测数 据,主要应用于某个 区域 的地形分 析, 前面 的几 种方法 只能 反映现 象的 水平 分布 特征 , 对 垂直 分布 特征是 无能 为力的 。 数 字 高 程表示法广泛地用于工程、规划和军事领域。 1)地貌晕渲图( Shaded Relief Map)及其与专题地图叠置 为了增 加丘 陵和 山地 地区 描述高 差起 伏的 视觉 效果 , 制 图 工 作 者 成 功 地 运 用 了一种 “阴 影立体 法” 即地 貌晕 渲法 。 用 这 种 技 术 绘 制 的 图 件 看起来 很动 人, 但费 用太 高, 晕 渲 法 的 质 量和精度很大程度上取决于制图工作者的主观意识和技巧。 数字地 形图 投入 生产 并加 以应用 后 , 地 貌晕渲 便能 自动 、 精 确地 实现 。 自 动 晕渲的 原理 是基于 “ 地 面 在人们 眼里 是什么 样子 , 用何种 理想 的材料 来制 作 , 以什 么方 向为光 源照 明 方 向” 等的 考虑 。 制 图输 出 时如果 用灰 度级 和连 续色 调技术 表示 明暗 程度 , 得 到的成 果看 起来 与航片 十分 相似 。 实 际上 , 从 高程 矩阵 中自动 生成 的地貌 晕渲 图与 航片 有许 多不同 之处 。 主 要表现在: 第一,晕渲图不包括任何地面覆盖信息,仅仅是数字化的地表起伏显示; 第二,光源一般确定为西北 45 度方向,航片的阴影主要随太阳高度角变化; 第三 , 晕渲 图通 常都 经过 了平 滑 和 综 合 处 理 , 因而 没有 航片上 显示 出的 丰富 的地 形细节 。 自动地 貌晕 渲图 的计 算非 常简单 , 首 先 是 根 据 DEM 数据计 算坡 度和 坡向 。 然 后将坡 向 数据与 光源 方向 比较 , 面 向光源 的斜 坡得 到浅 色调 灰度值 , 反 方 向的得 到深 色调灰 度值 , 两 者之间得到中间灰度值。灰度值的大小则按坡度进一步确定。 计算晕渲图的主要研 究集 中于坡面反射率的定 量描 述,由于计算反射率 的公 式都较复 杂, 因 此 , 将 坡 度 和 坡 向 转换成 反射 量, 常用 建立 查找表 的方 法来 解决 , 使 计算和 处理 更为 有效(图 11-12) 。 图 11-12:地貌晕渲图示意 晕渲图 本身 可以 描述 地表 三维状 况, 而且 在地 形定 量分析 中的 应用 不断 扩大 。 如 果 把 其 它专题 信息 与晕 渲图 叠置 组合在 一起 , 将大幅 度提 高地图 的使 用价 值。 例如 , 运 输线 路规 划 图与晕渲图叠加后大大增强了直观感等,这是传统方法不能实现的。 2)三维曲面 许多 GIS 软件 都提 供了 利 用 DEM 数据 生成 三维 投 影的功 能, 通常三 维透 视 图有两 种形 式, 即平 滑的 三维 曲面 和 网状图 ( Fishnet Diagram) (图 11-13,图 11-14) , 其 中在三 维曲 面 图上还 可以 叠加 其它 信息 ,最典 型是 叠加 同一 区域 的遥感 图像 或者 该 DEM 生成的 晕渲 图, 以增强 其“立 体感” 。生成 三维透 视图, 需要设 置视 点位置 、视角 等参数 ,因 此可以 通过设 置不同的参数,生成连续的三维透视图,并组成动画,达到“虚拟飞行”的效果。 图 11-13:曲面三维透视图 图 11-14:网状三维透视图 在 利 用网格 DEM 生成 三 维曲面 以及 地貌 晕渲 图的 过程中 , 值 得 注 意 的 一 点 是 : 如 果 分 辨率高 , 则 数据 量很 大, 降低了 计算 速度 ; 分 辨率 过低, 则会 使计 算结 果变 得粗糙 , 这 时可 以考虑 在网 格点 之间 利用 曲面函 数拟 合 , 但是 由于 曲面函 数是 连续 的, 使得 结果显 得 “ 不 真 实” ,一个较好解决办法是利用分形内插,后者可以生成细致的、更为自然的地形。 3. 3 专题地图内容的表现手段 专题地 图多 种多 样的 表示 方法, 需要 通过 一定 的手 段来实 现。 选择 合理 的表 示方法 和表 现手段 , 是提 高科 学内 容表现 能 力 的 保 证 。 现有 的表 达 手段可 归纳 为色 彩、 线条 和 注记三 种。 3. 3. 1 色彩 世界上 的物 体, 均有 形状 和色彩 两个 基本 特征 。 色 彩通常 分为 两类 : 一 类是 黑白及 各 种 灰色,称为非彩色;一类是彩色,包括除黑、白、灰以外的颜色。 色彩不 仅能 弥补 单色 图的 缺陷, 丰富 图幅 内容 , 提 高专题 地图 的使 用价 值, 更能如 实 反 映制图 物体 的自 然面 貌 , 扩大地 图内 容的 感染 力 , 增强地 图内 容的 清晰 易读 性。 图 11-15 为 RGB 彩 色 立 方 体 , 红 绿 蓝 三原色 被设 置在 彩色 立方 体的三 个角 上。 立方 体下 方的角 ,三 原 色强度 为 0,颜 色为 黑; 横穿立 方体 的对 角线 是强 度轴, 范围 从起 点黑 ( R, G, B) =( 0, 0, 0)到 白( R, G, B) =( 100, 100, 100) ,这 里, 强度 以百 分比 来表 示;立 方 体 中 任 何 一点的 颜色都 可以通 过红 、绿、 蓝( R, G, B)三 轴上的 设值来 描述; 如( 50, 50, 50) 是暗灰 色, ( 0, 0, 100) 是纯蓝 色等 等。 红、 绿、 蓝被称 为加 色, 因为 新的 颜色都 可以 通过 它们加 到黑 色上 来获 得。 同样, 减色 三原 色也 可以 在彩色 立方 体予 以表 示, 它们是 青色 、 品 红色和 黄色 ( C, M, Y) , 分布在 剩余 的三 个角 上。 青由蓝 和绿 合成 , 品 红色 由蓝和 红合 成, 黄由绿 和红 合成 , 染 料和 打印油 墨用 减色 三原 色, 通过从 白色 中减 去它 们的 补色来 生产 其他 颜色。 这样 ,在 影像 显示 时,颜 色 用 R、 G、 B 来 度量, 在打 印和 绘图 时, 则用 C、 M、 Y 来度量。 图 11-15: RGB 颜色立方体 在实际 印刷 出版 应用 中, 由于难 以用 青色 、 品 红色 和黄色 合成 真正 的黑 色, 因此一 般 采 用的是 C、 M、 Y、 K(黑 色)色 彩度 量。 除了 RGB 和 CMYK 颜色度 量空 间之 外,还 有其 它一些颜色表述方式: 1) HLS 颜色表 述, HLS 指色调 ( Hue) ,亮 度( Brightness)和 饱 和 度( Saturation) ,它 更能够 反映 人对 色彩 的感 知。 RGB 色 彩 空 间 尽 管 组 成了一 个立 方体 ,但 是并 非是线 性的 , 即两个 颜色 的相 近程 度不 能简单 的用 欧式 距离 来度 量。而 HLS 色度 空间 则较 好的解 决了 该 问题, 色调 反映 了人 们对 颜色的 分类 , 如 “纯 红” 、 “品红 ” 、 “桃 红” 等属 于红 色 调 ; 亮 度 说 明了颜 色 “ 黑 ” 的程 度, 白色亮 度最 高, 黑 色 最 低 ; 饱和度 则反 映了 颜色 的 纯度, 如 果 一 个 颜色掺入灰色,则饱和度降低,例如,桃红色饱和度低于纯红色。 2) CIE 颜色 系统 , CIE( Commission International de I’Eclairage)颜色系 统是 国 际的通 用颜色标准。它提供了一个一致的颜色定义方法,但是过于复杂,不易掌握。 3)孟 塞 尔 [Munsell]颜 色 系 统 , 这 是 被 广 泛 使 用 的 进 行色彩 设计 时的 系统 , 它 采用色 调、 色值( Value 相 当于亮 度) 、色品( Chroma,相当 于 饱和度) 来描 述颜色 ,并 且使用一 个比 例数值来反映人的感知。 各种色 彩度 量分 别应 用于 不同的 方面 , 在 地理 信息 系统中 , 因 为同 时要 考虑 屏幕显 示和 制图输 出, 所以 通常 要兼 顾考 虑 RGB 色度 和 CMYK 色度。各 种色 度系 统之 间可以 相互 转 换, 转 换 一 般 采 用 经 验 公 式 。 一 个好 的转 换公 式可 以使彩 色图 像在 不同 的输 出设备 上达 到一 致的视觉效果,但是往往较为复杂。 3. 3. 2 线条 线条实 质上 是点 、 线 、 面 状符号 的简 称, 是显 示制 图现象 数量 和质 量的 重要 手段, 与 色 彩搭配使用,可大大地增加科学内容的表现能力。如图 11-16 所示。 图 11-16:各种线条样式 3. 3. 3 注记 注记是 上述 两种 手段 的补 充, 注记 应紧 密结合 专题 内容 , 可 增强 现象的 显现 效果 。 对 于 类型图和区划图,一般都要利用注记。 GIS 中使用的硬拷贝设备: 在 GIS 制图 输出 时, 要采用 硬 拷 贝 设 备 ( Hard Copy Devices) ,所 谓硬 拷贝 设 备,是 相 对于屏 幕显 示的 “软 拷贝 ” 而 言 , 前 者 依 赖 于 数 据 , 并且 不能 长期 保存 , 而 硬拷贝 输出 的内 容则可以长期保存。 1.栅格打印机和绘图仪 栅格输 出设 备通 过点 阵产 生的图 像来 输出 地图 , 根 据输出 质量 高低 、 输 出幅 面大小 的不 同,又可以分为: 1. 1)点阵打印机 点阵打印机是最简单的栅格打印机,适用于对输出质量要求不高、节约成本的情形。 1. 2)喷墨打印机 与普通 点阵 打印 机相 比, 喷墨绘 图仪 可以 打印 幅面 更大 、 质 量更 高的地 图 , 目前高 质量 的喷墨绘图仪输出精度可以超过 1000DPI。 1. 3)静电绘图仪 主要用于输出大幅面(超过 2m)的地图。 1. 4)激光打印机 目前黑 白激 光打 印机 主要 用于输 出文 本, 也可 用来 打印灰 度图 形, 彩色 激光 打印机 可以 用于打印高质量的地图。 1. 5)激光绘图仪 激光绘图仪可以达到非常高的分辨率( 2000DPI) ,用于打印大幅面地图。 1. 6)热蜡(热转印)打印机 热蜡打印机可以打印更亮、对比度更强的图像。 1. 7)热升华打印机 热升华 打印 机机 理是 将颜 料加热 升华 为气 态, 并输 出到纸 面上 , 热 升华 使得 每个输 出稍 微模糊,适合于输出照片、图像等,但是不适于打印文字。 2.矢量模式的笔式绘图仪 笔式绘 图仪 直接 以矢 量方 式工作 , 它 通过 一系 列的 命令来 操纵 绘图 笔进 行绘 制, 它 可 以 达到很 高的 输出 分辨 率, 但是实 现时 需要 将地 图数 据全部 转换 为矢 量格 式, 笔式绘 图仪 的另 一个不足是输出复杂的地图时,需要时间较长。 3.照相 即用照相机对屏幕进行拍摄,得到图像,这种方式最为简单,在精度要求不高的情况下 可以采用。 4.专题地图设计 专题地图的总体设计,是指任务和要求明确后初步提出的图幅基本轮廓,包括投影选择、 明确比例尺、划定图幅范围、进行图面规划和绘制设计略图等内容。 4. 1 图幅基本轮廓的设计 专题地图的总体设计,比普通地图和国家基本地形图复杂多样。编制一幅专题地图,不 仅要学科专业与制图的紧密结合,而且要对图幅的用途和使用者的要求有深入的了解和掌 握。在此基础上,才能进行设计图幅的基本轮廓。具体要了解的内容包括: 1)该图幅是专用还是多用 专题地图既能专用也可多用,而且愈来愈向多用方向发展,并相应地产生了一版地图多 种式样的作法。 2)已出版的类似专题地图 分析这些图件在使用中的优缺点,吸收长处,改进不足,以便更好地满足地图使用者的 需要。 3)明确地图使用者的特殊要求 根据不同的读者对象、不同用途以及不同使用场合等要求,考虑到所编制的专题地图是 作为规划用的还是作参考用的、教学用的等,予以满足。 在弄清上述图幅的用途与要求之后, 就要明确总体设计的指导思想,拟定专题内容项目, 突出重点,提出图幅总体设计的方案。 4. 2 制图区域范围的确定 专题地图图幅的区域范围,是根据用途和要求来确定的。范围选择是否合适,在很大程 度上影响着图幅的使用效能,并与专题地图的数学基础有紧密的联系。与普通地图一样,根 据图幅范围可分为单幅、单幅图的“内分幅”、分幅三种形式。 4. 2. 1 单幅 这是指一幅图的范围能完整地包括专题区域而言,通常叫截幅。专题区域放置在图幅的 正中,它的形状确定了图幅的横放、竖放和长宽尺寸。专题区域与周围地区的关系要正确地 处理。为了便于阅读和使用,专题地图一般以横放为主要式样; 有些专题区域性形状是长的, 而地图的方向习惯是上北下南,所以只好竖放。 4. 2. 2 单幅图的“内分幅” 这是指超过一张全开纸尺寸而分为若干印张而言。“内分幅”应按纸张规格,一般分幅 不宜过于零碎,分幅面积的大体相同。 4. 2. 3 分幅 分幅是地形图普遍采用的一种形式。分幅图不受比例尺限制,分幅图的分幅线是根据区 域大小采用矩形分幅和经纬线分幅的,分幅图原则上是不重叠的。 此外,图廓内专题区域以外的范围如何确定,在总体设计时也应明确下来。方法有: 第一,突出专题区域线,区内区外表示方法相同,只把专题区域界线加粗,或加彩色晕 边,以显示专题区域范围,同时也能与相邻区域紧密联系; 第二,只表示专题区域范围,区域外空白,突出专题区域内容,区内要素与区外没有什 么联系。 第三,内外有别,即专题区域内用彩色,区外用单色,且内容从简。这是专题地图普遍 采用的方法。 4. 3 专题地图数学基础的设计 专题地图数学基础包括地图投影、比例尺、坐标网、地图配置与定向、分幅编号和大地 控制基础等,其中地图投影和比例尺是最主要的。 4. 3. 1 影响数学基础设计的因素 1)专题地图的用途与要求 这是影响数学基础设计的主导因素,因为投影和比例尺都是根据图幅的用途和要求选择 设计的。 2)制图区域的地理位置、形状和大小 该要素是一个重要的因素,位置和形状往往影响投影和比例尺的选择。在设计时对制图 区域的形状和大小要详细研究,并同时设计几个方案,选择一个合理的方案。 3)地图的幅面及形式 地图的幅面及形式都对数学基础设计有一定的影响,直接关系到使用效果。 4. 3. 2 投影和比例尺的设计 1)投影设计 在专题地图制图中采用较多的是等积投影和等角投影,具体设计时采用何种投影,要视 专题地图的用途和要求而定。 2)比例尺设计 专题地图比例尺的设计应考虑图幅的用途和要求,根据制图区域形状、大小,充分利用 纸张有效面积,并将比例尺数值凑为整数。在实际设计地图比例尺的工作中,往往还会出现 一些特殊的问题,如:不要图框或破图框、移图、斜放。 4. 4 图面设计 专题地图不仅要有科学性,而且也要有艺术性。图面设计包括图名、比例尺、图例、插 图(或附图)、文字说明和图廓整饰等。 4. 4. 1 图名 专题地图的图名要求简明图幅的主题,一般安放在图幅上方中央。字体要与图幅大小相 称,以等线体或美术体为主。 4. 4. 2 比例尺 比例尺有两种表示方法:一是用文字(如一比四百万)或数字(如 1: 4000000)表示; 二是用图解比例尺表示。图解比例尺间隔也有两种划分方法,一种是按单位长度划分,表明 代表的实际长度;一种是按实地公里数划分,每格是按比例计算在图上的长度。比例尺一般 放在图例的下方,也可放置在图廓外下方中央或图廓内上方图名下处。 4. 4. 3 图例 图例符号是专题内容的表现形式,图例中符号的内容、尺寸和色彩应与图内一致,多半 放在图的下方。 4. 4. 4 附图 附图是指主图外加绘的图件,在专题地图中,它的作用主要是补充主图的不足。专题地 图中的附图,包括重点地区扩大图、内容补充图、主图位置示意图、图表等。附图放置的位 置应灵活。 4. 4. 5 文字说明 专题地图的文字说明和统计数字,要求简单扼要,一般安排在图例中或图中空隙处。其 他有关的附注也应包括在文字说明中。 专题地图的总体设计,一定要视制图区域形状、图面尺寸、图例和文字说明、附图及图 名等多方面内容和因素具体灵活运用,使整个图面生动,可获得更多的信息。图 11-17 展示 了一些不同风格的图面设计。 图 11-17:图面设计示例 5.制图综合 (制图概括 ) 地理信 息系 统中 地理 信息 综合功 能的 研究 和开 发是 当前 GIS 进步与 应用 发展 所面临 的 一个新 的挑 战。 由于 GIS 技术和 应用 迅速 发展 所处 理的问 题也 更加 复杂 化, 这使得 GIS 中 地理信 息的 有效 利用 和表 达问题 显得 越来 越突 出。 因此, 人们 不得 不开 始关 注 GIS 中地 理 信息综 合功 能 , 将基 本比 例尺数 据派 生出 多比 例尺 、 多 用途 和多 专题的 更多 有用信 息 , 并 提 高地理信息的表达和利用的效率,满足 GIS 的可视化和各种分析、制图输出的需要。 5. 1 制图综合的概念 制图综合是对制图区域客观事物的取舍和简化。经过概括后的地图可以显示出主要的事 物和本质的特征。地图的比例尺、用途和主题,制图区域的地理特征以及符号的图形尺寸是 影响制图综合的主要因素,制图综合主要表现在内容的取舍、数量简化、质量化简和形状化 简等方面。 专题地图制图综合的实质,就是在科学分析研究各种专题内容要素特征的基础上,根据 图幅的用途和比例尺,将图幅的专题内容加以概括化,把最主要的要素、对象的基本轮廓、 主要的特征和基本规律反映在地图上。专题地图制图综合围绕着几何性和地理性两方面进 行。在几何性方面对制图对象形状和大小综合简化,在地理性方面对专题内容的综合概括。 制图综合就是几何正确性和地理真实性的紧密结合。 5. 2 影响制图综合的主要因素 制图综合的程度受各种因素的影响,主要因素有:地图比例尺、地图的主题和用途、制 图区域的地理特征以及符号的图形尺寸等。 5. 2. 1 地图比例尺 比例尺对制图综合的影响非常明显。由于比例尺的缩小,同一个制图区域在图上的面积 随之缩小,因而图上所能表示的地物数量也相应减少。当地图幅面一定时,不同比例尺地图 所包括的实地范围不同,大比例尺地图所包括的地面面积较小,小比例尺地图包括的地面面 积较大。在不同范围内,对同一地物重要程度的评价并不相同,有些事物从小范围看是重要 的,但在大范围内可能是次要的。 5. 2. 2 地图的用途 任何一幅地图所能表示的内容都是有限的,只能满足某一方面或某几方面的要求,所以 地图内容的选择和表示,就必须考虑到地图的用途。地图用途既然直接决定着地图内容,因 而就影响着制图综合。例如 1: 50 万比例尺地形图和 1: 50 万比例尺政区图,由于两者用途 不同,地图内容的取舍和化简程度就很不一样。 1: 50 万比例尺地形图是国家基本地形图之 一,在军事上是战役用图,经济上是规划用图,在科学研究方面是参考用图,在这种地图上 要全面地反映制图区域的自然和社会经济方面的基本情况;而 1: 50 万比例尺政区图是省级 机关进行行政管理、布署工作用图,在图上主要表示社会经济要素(如境界、居民地、交通 线等),而对自然要素(如地形、土质、植被等)则可作较大的概括。 5. 2. 3 地图的主题 地图的主题即地图上所反映的主要内容,它决定各事物在图上的重要性,因而影响制图 综合程度。这在专题地图上表现特别明显,例如比例尺相同的同样地区但主题不同的两幅地 图,一幅是地形图,一幅是政区交通图,前者主要表示地形特征及水系,居民地较少,不表 示铁路和公路;后者重点表示行政区划、铁路和主要公路、各级行政中心以及作为交通枢纽 的居民地,对于水系则只是表示主要的河流和湖泊,一般不表示地形。 5. 2. 4 制图区域的地理特征 制图区域地理特征是指该区域的自然和社会经济条件,地面上不同地区具有不同的地理 特征,因此制图综合时就要选取那些能反映区域特征的事物,舍去那些不代表区域特征的事 物。同样的地理事物在不同地区具有不同的意义,这就影响着制图综合。例如,小城镇在人 口稠密的地区是次要的,图上一般不表示,而在人口稀少的地区,小城镇则成为主要的居民 地,图上要选取。 5. 2. 5 符号的图形尺寸 各种地理事物,在图上均以符号表示。符号的图形、尺寸直接关系着地图的负载量,因 而也影响着制图综合的程度。图形尺寸规定得小一些,选取的内容就可以多一些,概括程度 就小一些,地图的内容就会详细一些,图面负载量就大一些;反之,地图内容必然简略,图 面负载量就小。此外,几何图形的最小尺寸与图形的结构和复杂程度有关,轮廓符号的最小 尺寸受轮廓界限的形式、内部颜色和背景等一些因素影响,可见符号图形最小尺寸是确定制 图综合的必要参考数据。 5. 2. 6 可视化要求 可视化是地理信息处理的窗口与处理结果的直观表达形式,因而是决策的直观依据。只 有把空间数据库中的海量数据转换为直观的图形信息,地理信息处理结果才能为规划、管理 与决策提供有力的支撑。 5. 3 制图综合的基本方法 制图综合是一个高度智能化的和具有创造性的作业过程,它是一个整体任务,包含了一 系列不同性质的操作,可以分解为若干个子过程来实现。由于这些子过程之间缺少明确的内 在或逻辑联系,使得这些子过程是以某种混合形式来组合应用。不同学者对制图综合过程提 出了不同的分解模式:如三算子模式:选取、概括和移位;四算子模式:选取、概括、合并 和移位;七算子模式:纯几何综合包括简化、夸大、位移;几何 /概念综合包括选取、合并 类型化和强调。 传统的制图综合包括的内容主要有:选择主要的对象,确定主要对象的选取标准;概括 数量特征,主要从缩减分级、改变表示方法着手;综合质量特征,将一些相近的分类分级予 以归并,利用组合符号代替单个符号;简化轮廓图形,包括简化符号线划和轮廓界线,合并 小面积图斑成为大面积的轮廓,夸大具有特征的小面积轮廓;去掉一些小指标,转化为总的 指标等。 启发式制图综合是把整个优化过程分解为若干个子过程来实现,这些子过程基本上等同 于传统制图综合的某些手法(如选取、概括、合并与位移等)。在概括过程中,如弯曲海岸 线的概括意味着相应的港湾或海角的取舍。“英国海岸线长度问题”是新兴学科“分形学” 中的一个典型的问题。分形几何是用来描述难以用欧式几何来描述的具有多层嵌套的自相似 结构。 地图 中的 河系, 地 貌中的 沟叉 , 城 市中 的大 道、 胡 同 、 小 巷、 里 弄 等 , 均具 有嵌 套特 征,是典型的分形结构。分形几何原理在地图信息处理中必将得到应有的深入应用。 分形: 分形一 词( Fractal)是 B. Mandelbrot 用拉 丁词 根创 造的单 词, 意思 是细 片、 破碎、 分 数、分 级等 。它 是那 些局 部和整 体按 照某 种方 式相 似的集 合 [B. Mandelbrot]。 分形具 有以 下 特征: 1)具有精细的结构,在任意小的尺度之下,总有复杂的细节; 2)分形是不规整的,它的整体和局部都不能用传统的几何语言来描述; 3)通常具有自相似形式,这种自相似可以是近似的或者是统计意义上的; 4)一般 的,分 形的某 种定 义之下的 分形 维数大 于其 拓扑维数 ,例 如在平 面上 ,一条 分 形曲线的维数在 1-2 之间; 5)在大多数情况下,分形以非常简单的方法确定,可以由迭代过程产生。 分形是 描述 不规 则几 何形 态的有 力工 具 , 而自 然界 的许多 物体 , 都具有 分形 的特性 , 如 海岸线 、 地 形 、 云、 甚至 生物等 等。 对 于 一 条 海 岸 线而言, 无论 从遥 感卫 星 上看, 还 是 从 岸 边的悬 崖上 看, 它 总 是 曲 折的。 因此, 对于这 些地 物, 要完 全 “ 精确” 的描 述其几 何形 状是 不可能的,在 GIS 数字化的过程中,要进行抽样操作。 图 11-18:点符号的综合 总之, 制图 综合 的基 本方 法为内 容的 取舍 、 数 量化 简、 质 量 化 简 和 形 状 化 简 。 图 11-18、 图 11-19 和图 11-20 分别是对点状符号、线状符号和面状符号的综合。 图 11-19:线符号的综合 图 11-20:面状符号的综合 5. 3. 1 内容的取舍 内容的 取舍 是指 选取 较大 的、 主 要 的 内 容 而 舍 去 较 小的、 次要 的或 与地 图主 题无关 的内 容。 选 取 主 要 表 现 在 : 一 是选取 主要 的类 别, 二是 选取主 要类 别中 的主 要事 物。 舍 去 主 要 表 现在 : 一 是舍 去次要 的类 别, 二是 舍去 已选取 的类 别中的 次要 事物 。 注 意所 谓的主 要与 次 要 是相对的,它随着地图的主题、用途、比例尺的不同而异。地图内容的选取,一般按下列顺 序进行: 1)从整体到局部:进行选取时,要首先从整体着眼,然后从局部入手。 2)从主要到次要:地图上所表示的各个要素,根据地图的主题和用途,总有主要与次 要之分。选取时要遵循先主要后次要的顺序进行。 3)从高级到低级:这样可以保证较高级的能被选择,不至于遗漏。 4)从大到小:这样可以保证大的事物首先入选。 总之,选取时要从总体出发,首先选取主要的、高级的、大型的事物,再依次选取次要 的、低级的、小型的事物,最后还要从整体上进行分析,观察是否反映了制图区域的总体特 征。 5. 3. 2 质量特征的化简 地图上各事物的质量差别通常是以分类来体现的。质量特征的化简就是减少一定范围内 事物的质量差别,用概括的分类代替详细的分类,即按事物的性质合并类型或等级相近的事 物。例如,将针叶林、阔叶林和混交林合并为森林;将喀斯特山地、喀斯特丘陵、喀斯特台 地、喀斯特溶蚀堆积盆地合并为喀斯特地貌。 5. 3. 3 数量特征的化简 数量特征的化简就是减少事物的数量差别,增大数量指标内部变化的间距,对于数量指 标低于规定等级的事物不予表示。在用等值线表示数量特征的地图上,化简时要扩大等值线 间距值。进行数量特征化简时,不仅要考虑地图比例尺和用途,而且要特别注意考虑事物数 量分布的特点及保持具有质量意义的分级界限。 5. 3. 4 形状化简 形状化简用于呈线状和面状分布的事物。形状化简的目的在于保留事物本身所固有的、 典型的特征。化简的方法有删除、夸大和合并。删除就是去掉那些因比例尺缩小而无法清楚 表示的碎部。有时为了显示和强调事物平面图形的特征,将本来按比例应删除的小弯曲,夸 大表示出来。合并就是将邻近的、间隔小到难以区分的同类事物的图形加以合并,以表示出 事物的总体特征。对某种事物进行形状简化时,要考虑到与其他事物的关系,使彼此之间能 协调一致。例如对湖泊进行形状化简时,要注意与地形、水系的关系。 6.地理信息的可视化 6. 1 基本概念 可视化(Visualization)是指在人脑中形成对某物(某人)的图像,是一个心理处理过 程,促使对事物的观察力及建立概念等。科学计算可视化是通过研制计算机工具、技术和系 统,把实验或数值计算获得的大量抽象数据转换为人的视觉可以直接感受的计算机图形图 像,从而可进行数据探索和分析。把地学数据转换成可视的图形这一工作对地学专家而言并 不新鲜。测绘学家的地形图测绘编制,地理学家、地质学家使用的图解,地图学家专题、综 合制图等,都是用图形(地图)来表达对地理世界现象与规律的认识和理解。科学计算可视化 与上述经典常规工作的最大区别是科学计算可视化是基于计算机开发的工具、技术和系统, 而过去地学中的可视表达和分析是手工或机助的(计算机辅助制图),并把纸质材料作为地图 信息存储传输的媒介。 科学计算可视化,自从80年代末提出以后,得到了迅速的发展并成为一个新兴的学科, 其理论和技术对地学信息可视表达、分析的研究与实践产生了很大的影响。国际地图学会 (ICA)在 1995年成立了一个新的可视化委员会,并在 1996年6 月与计算机器图形协会(ACM SIGGRAPH)合作,开始一个名为“Carto-Project”的研究项目,其目的是探索计算机图形学 的技术与方法如何更有效地应用在地图学与空间数据分析方面,促进科学计算可视化与地图 可视化的连接和交流。地学专家对可视化在地学中的地位和作用,已进行了比较深入的讨论, 从不同的角度提出了与可视化密切相关的地图可视化、地理可视化、GIS可视化、探析地图 学(Exploratory Cartography)、地学多维图解、虚拟地理环境等概念,但有不同的理解, 对其相互关系的认识也不明确。 地理信息系统的多维可视化是指采用 2.5 维、三维和四维等地图表现形式来反映地理客 体的多维特征,其中 2.5 维形式是图面上有隐藏部位的鸟瞰式地图表现形式, 又称 “假三维”, 例如表示矿床的面层,可用显示为同分异状的等值线或不规则三角网中的小块平面来表示, 而面上的高程值都不是一个独立的变量,在任一给定的位置仅能用一个高程值表示一个面。 三维形式则是真正的三维立体显示,三维技术可分为基于面表示和基于体表示,其中面表示 可容易地为地层及其构造提供精确的空间描述,特别是构造复杂的地带或岩石断层处,然而 这些面仅将地表面以下部分分成许多区域,各区域内的不同地质条件不容易描述;体表示将 整体细分成大量的体元(Voxels ),体元及其变异的一个主要的优点是易于表示异质特征的 整个三维分布状况。四维是除了三维立体以外,再增加一维属性值(一般是时间维) ,GIS 的时间查询能力目前还不常见,但是地理学家可能想对某一时刻的所有地理条件或某一时间 段内的平均地理条件进行评价,这时,就需要获得不同时刻的数值。为了充分满足这种需要, 时间数据获取能力应该与三维模型相结合,如分析并预报水灾、地震、暴风雨及滑坡等。 地理信息的多维可视化在地球科学中具有重要意义,它对于动态地、形象地、多视角地、 全方位地、多层面地描述客观现实,对于虚拟化研究、再现和预测地学现象,都有突出的方 法论意义。例如,在地质科学中用真三维反映地下矿体、矿脉(如含油体、含水体、金属矿 脉等),能够帮助人们发现用常规手段难以发现的地质现象和矿藏;在大气科学中用四维 (真 三维加时间维)形式表示气旋、龙卷风、降水云系的发生、发展和演化过程;在地理学中用 四维方式模拟整个河床内洪水的流动、涨落、对河堤的侵蚀,以及决堤后封决口时的水下状 况,等等,都具有十分重要的科学价值和明显的实用意义。 6. 2 地学可视化的类型 地学可视化包括地图可视化、地理信息系统(GIS)可视化及其在专业应用领域的可视化。 地图可视化与GIS可视化是地学可视化理论和技术的两个基础部分。地学多维图解是从非可 视化角度提出的,关于图的地学知识表达、获取以及图的地学问题解的求证原理和方法,是 地学可视化的高一级发展阶段。地图可视化中的信息表达交流模型和地理视觉认知决策模型 的研究,将从理论上促进地学多维图解模型的进一步发展。基于虚拟现实技术和计算机网络 技术的虚拟地理环境是地学可视化、地学多维图解理论和技术发展的最后集成系统。 地学可视化是科学计算可视化与地球科学结合而形成的概念, 是关于地学数据的视觉表 达与分 析, 下面 探讨 该领 域中的 三个 概念 : 地 图可 视化、 地理 可视 化和 GIS的可视 化, 及其 相互关系。 6. 2. 1 地图可视化 可视化对现代地图学 的发 展有着极其重要的作 用, 虽然对其理解还有着 一定 的分歧。 Taylor 强 调 了计算 机技 术 基础支持 下的 地图可 视化 ,并认为 可视 化包括 交流 与认知分 析。 MacEachren 则 强 调交流 与 可视化在 地图 学中的 应用 ,而不是 地图 的技术 制作 ,并把可 视化 与交流作为并列的两个要素。 在可视 化的 过程 中 , 信 息 交 流传输 以及 认知 分析 的界 限并不 需要 很清 楚地 划分 。 事实上 , 它们一 直融 合在 一起 , 并 具 有共同 作用 的特 点。 由于 可 视化的 两个 特点 , 即 交 流 与 认知分 析, 从而对现代地图学的理论和方法产生影响。图 11-21表示了地图可视化的概念框架。 地图可视化 虚拟地 图 理论 信息 表达交流 模型 地理视 觉认知 决策模 型 技术 动态地 图 交互交融 地图 超地 图 图 11-21:地图可视化的概念框架 由于可 视化 具有 交流 与认 知分析 的两 个特 点 , 从 而 使 信息表 达交 流模 型与 地理 视觉认 知 决策模 型构 成了 地图 可视 化的理 论, 而这 两个 模型 将应用 于计 算机 技术 支持 的虚拟 地图 、 动 态地图、交互交融地图以及超地图的制作和应用等。 虚拟地图指计算机屏 幕上 产生的地图,或者利 用双 眼观看有一定重叠度 的二 幅相关地 图,从 而在 人脑 中构 建的 三维立 体图 像。 虚拟 地图 具有暂 时性 ,实 物地 图具 有静态 永久 性 。 虚拟地 图和 人的 心智 图像 相互联 系与 作用 的原 理和 过程, 同传 统的 实物 地图 是不一 样的 , 需 要建立新的理论和方法。 动态地 图是 由于 地学 数据 存贮于 计算 机内 存 , 可 以 动 态地显 示关 于地 学数 据的 不同角 度 的观察 , 不 同 方 法 (如 不同 颜色、 符 号 等 )的表 达结 果, 或者 地学 现象 随时 间演 变 的过程 等等 。 由于地 图的 动态 性, 地学 现象的 表达 在时 间维 上展 开。 所以 , 传 统的 关于 纸 质静态 地图 的符 号制作 、 符 号 注记等 制作 理论和 方法 在动 态时 不再 完全适 合 。 另 外 , 人 又 是 如何认 知分 析动 态的信息流等需要进一步的探讨和深入研究。 交互交 融地 图是 指人 与地 图可进 行相 互作 用和 信息 交流 。 交互 地图 是人 可以 通过 一 定 的 途径, 例如 选择 观察 数据 的角度 、修 改显 示参 数等 来改变 地图 的显 示行 为。 在这个 过程 中 , 屏幕地 图( 或双 眼视 觉立 体 地图) 即虚 拟地 图, 与应 用 人员人 脑中 相关 地学 知识 以及直 觉等 形 成的心 智图 像一 直处 于相 互作用 、 相 互 比 较 、 相 互 修改完 善的 信息 联系 和反 馈状态 。 交 融 地 图,是人 与地图 的融 合程 度,也就 是人 在虚拟 地图 中的投入 感和 沉浸感( Immersion)。地 图 的交互 和交 融性 的区 别可 以举这 样的 一个 例子 。 如 你到图 书馆 借书 , 交 互性 表示你 借书 要通 过图书 馆的 服务 员, 首先 填写条 子, 然后 服务 员去 找书, 最后 再给 你。 而交 融性是 你可 以直 接进入书库进行搜寻,并发现你要借的书。虚拟现实技术是交互交融地图的发展基础。 超地图( Hyper-maps)是 基 于万维网 (WWW)的与地 学相 关的多媒 体,可 以让用 户 通过主 题 和空间 进行 多媒 体数 据的 导航, 这与 超文 本的 概念 相对应 。 超 地图 提出 了万 维网上 如何 组织 空间数 据并 与其 它超 数据 (如文本 、 图 像、 声音、 动画 等)相 联 系 的 问 题 。 超 地图 对于地 图的 广泛传 输与 使用 , 即 对公 众生活 、 社 会决 策、 科 学 研 究等产 生巨 大的 作用 , 具 有重要 的意 义 。 6. 2. 2 地理可视化 地理可 视化 是地 学可 视化 中另一 个被 使用 的概 念 。 MacEachren开始 时采 用地 图可视 化, 但他认 为地 理可 视化 要大 于地图 可视 化的 研究 范围 , 如 遥感 图像 、 图 表、 摄影 影像等 中的 可 视化在 地图 可视 化中 并不 作为重 点研 究的 对象 。 所 以, 目前 他倾 向于采 用地 理可视 化 , 认 为 它包含 了所 有空 间显 示工 具,而 这些 所有 空间 显示 的集合 就是 现代 地图 学中 所指的 可视 化 。 Didase[1990]针 对科 学可 视化、 数据 探索 分析 以及 地理科 学的 应用 , 提 出了 地理可 视化 的作用 框架 , 强 调了 地理 研究过 程中 地图 的作 用, 它包括 数据 探索 , 假 设形 成并确 证, 综合 合成,到最后的结果表达与呈现(图 11-22)。 图 11-22:可视化作为地理研究工具的框架描述 [Didase] Didase 认 为 ,可视 化在研 究过程的 早期 侧重于 个人 特征的视 觉思 维,后 期侧 重于研 究 结果的 公众 交流 与传 输, 而这个 特征 会重 新建 立地 图学和 地理 学的 联系 , 因 为在过 去的 二三 十年中 ,地 图学 家把 大部 分的精 力放 在视 觉交 流传 输,而 地理 学家 (地 理制 图 学家) 在 20 世 纪的前 50 年则把研究放在视觉思维与视觉分析上。 地图学 与地 理学 作为 两门 经典学 科, 其研 究对 象均 为区域 地理 系统 , 但 前者 侧重于 地理 空间信 息的 地图 表达 与应 用, 后 者 则 把 地 图 作 为 一 种重要 的研 究工 具来 解决 地理问 题, 而可 视化具 有的 视觉 交流 传输 和视觉 分析 特征 , 则可 作为 桥梁把 地图 学与 地理 学紧 密地联 结在 一 起。 所以 , 虽 然地 理可 视 化可认 为来 自于 可视 化与 地理学 的结 合 , 地图 可视 化来自 于可 视化 与地图 学的 结合 , 但 是由 于可视 化具 有连 结和 融合 地理学 和地 图学 的特 点, 自然地 , 地 图 可 视化与 地理 可视 化是 属于 同一本 质的 两个 概念 , 只是 常规学 科领 域的 划分 以及 研究团 体的 不 同,导 致在 研究 内容 及范 围的认 识上 有所 侧重 。所 以 MacEachren 采用 地理 可视 化 , 而 不 倾 向于地 图可 视化 的原 因, 仍然是 从地 理学 与地 图学 领域的 经典 研究 特征 出发 , 而 不 是 着 眼 于 可视化的新技术特征,从而反映出学科领域划分对问题认识所带来的深刻影响。 6. 2. 3 GIS 可视化 20 世 纪 60年代 发展 起来 的基于 计算 机的 地理 信息 系统开 始形 成时 , 就 利 用 计算机 图形 软硬件 技术 , 把 地理 空间 数据的 图形 显示 与分 析作 为基本 的不 可缺 少的 功能 , GIS 可 视 化 要 早于科学计算可视 化的提 出。G IS 可视 化早期受限 于计算机二维图形 软硬件 显示技术的发 展,大 量的 研究 放在 图形 显示的 算法 上, 如画 线、 颜色设 计、 选择 符号 填充 、图形 打印 等 。 继二维 可视 化研 究后 , 进一 步发展 为对 地学 等值 面( 如 数字高 程模 型) 的三 维图 形 显示技 术的 研究, 它是通 过三 维到 二 维的坐 标转 换、 隐 藏线、 面消除、 阴影 处理、 光照 模型等 技术, 把 三维空间数据投影显示在二维屏幕上。由于对地学数据场的表达是二维的,而不是真三维实 体空间关系的描述,因此属于2.5 维可视化。但现实世界是真三维空间的,二维GIS 无法表 达诸如地质体、矿山、海洋、大气等地学真三维数据场,所以,从 80 年代末以来,真三维 GIS 及其体可视化成为 GIS 的研究热点。随着全球变化,区域可持续发展,环境科学等的发 展,时间维越来越被重视。而计算机科学的发展,如处理速度加快,处理与存贮数据的容量 加大,数据库理论的发展等使得动态地处理具有复杂空间关系的大数据量成为可能,从而使 得时态 GIS、时空数据模型、图形实时动态显示与反馈等的研究方兴未艾。所以,从GIS 及 其可视化的发展看,GIS 可视化着重于技术层次上,例如数据模型(空间数据模型,时空数 据模型)的设计,二维、三维图形的显示,实时动态处理等,目标是用图形呈现地学处理和 分析的结果。 6. 3 虚拟地理环境 地学可视化的数据探索和地学多维图解的实现需要高效的人与地学数据、地学问题形成 的图形场景的相互信息交流,也就是计算机系统能提供某种信息交流与反馈机制,可以让地 学专家充分发挥其图形图像思维能力和想象力,可以让地学专家设想某种假设,并立即得到 该假设导致的结果。虚拟现实技术可让人完全沉浸于某种计算机三维场景中,让地学专家把 注意力集中于地学问题上,而其充分高效的多感觉交互能力为地学的数据探索和地学多维图 解的技术实现,提供了可能。 虚拟现实(Virtual Reality)又称灵境技术,是指通过头盔式的三维立体显示器、数据 手套、三维鼠标、数据衣(Data Suit)、立体声耳机等使人能完全沉浸计算机生成创造的一 种特殊三维图形环境,并且人可以操作控制三维图形环境,实现特殊的目的。多感知性(视 觉、听觉、触觉、运动等),沉浸感(Immersion),交互性(Interaction),自主感(Autonomy) 是虚拟现实技术的四个重要特征,其中自主感是指虚拟环境中物体依据物理定律动作的程 度,如物体从桌面落到地面等。 虚拟现实技术、计算机网络技术与地学相结合,可产生虚拟地理环境 VGE (Virtual Geographical Environment)。虚拟地理环境是基于地学分析模型、地学工程等的虚拟现实, 它是地学工作者根据观测实验、理论假设等建立起来的表达和描述地理系统的空间分布以及 过程现象的虚拟信息地理世界,一个关于地理系统的虚拟实验室,它允许地学工作者按照个 人的知识、假设和意愿去设计修改地学空间关系模型、地学分析模型、地学工程模型等,并 直接观测交互后的结果,通过多次的循环反馈,最后获取地学规律。 虚拟地理环境特点之一是地学工作者可以进入地学数据中,有身临其境之感;另一特点 是具有网络性,从而为处于不同地理位置的地学专家开展同时性的合作研究、交流与讨论提 供了可能。 虚拟地理环境与地学可视化有着紧密的关系。虚拟地理环境中关于从复杂地学数据、地 学模型等映射成三维图形环境的理论和技术,需要地学可视化的支持;而地学可视化的交流 传输与认知分析在具有沉浸投入感的虚拟地理环境中,则更易于实现。地学可视化将集成于 虚拟地理环境中。 虚拟地理环境的发展与完善,除了依赖于计算机的虚拟现实技术外,还与地学信息获取 处理技术(如遥感、遥测等),地学分析模型构建水平,地学可视化,地学专家系统,地学空 间认知理论等的发展密切相关。虚拟地理环境对地学发展有重要的意义。虚拟地理学的提出 就表达了虚拟地理环境对地理学未来发展的作用和影响。另外,一般认为地理科学发展缓慢 的一个原因是无法进行室内试验,从而使地学假设理论无法得到实践的检验。虚拟地理环境 为地学工作者提供了可重复的信息模拟实验的可能,任何一个地学分析模型均可以由其他人 在虚拟地理环境中运行模拟,受到检验,从而加速地学理论的成熟和发展。 6. 4 地学可视化研究框架 可视化 来源 于科 学计 算可 视化, 带有 浓厚 的计 算机 技术特 征。 可视 化与 传统 的地图 学相 互作用 并融 合 , 从而 扩展 了可视 化本 身的 内涵 。 地 学可视 化除 了技 术特 征外 , 还 应建 立起 其 理论范 式 。 图 11-22 描 述 了地学 可视 化的 框架 , 以 及地图 可视 化 、 地 理 可 视 化 、 GIS可视 化、 地学多 维图 解 、 虚拟 地理 环境等 在框 架中 的位 置, 和它们 之间 的相 互关 系。 以计算 机科 学 为 基础的 地学 可视 化与 科学 可视化 学科 有较 大程 度的 叠合与 交叉 , 但 并不 能互 相替代 , 两 者之 间的相互联系、相互交流会促进两学科的共同发展。 地学可视 化包 括地图 可视 化、地理 信息 系统(G IS)可 视化及其 它们 在专业 应用 领域的 可 视化如 海洋 可视 化、 大气 可视化 、 地 质可 视化 、 社 会经济 可视 化等 。 地 学可 视化可 从地 图可 视化 和 GIS可视 化两 方面 进行理 论和 技术 的研 究 。 地 图可视 化的 研究 包括 信息 表达交 流模 型 和地理 视觉 认知 决策 模型 的构建 , 以 及 在上述 模型 指导下 的虚 拟地 图、 动态 地图 、 交 互交 融 地图 、 超 地图 的设 计 、 制 作和应 用 。 GIS 可 视化 的 研究包 括地 学体 三维 、 时 空多维 数据 内插 加密, 可视化 数据模 型设 计, 三 维、多 维数 据显示 与分析 ,矢量 、张量 和不 确定数 据显示 与分析 , 人 文、 经济 数据 可视化 , 实 时动 态交 互处 理, 并 行 技 术 , 基 于 网 络 和万维 网的 地学 可视化,多用户合作可视化等。 计算机可视 化 地球系统 地学可 视化 地学多维 图解 虚拟地理 环境 虚 拟现实 +网 络技术 地 球系 统 专 题应用领域 可视化( 如海洋、 大气、地 质、城市 、社会经 济等) 地 图可视化 GIS 可视 化 图 11-23: 关于地学可视化研究框架 地学多 维图 解是 从非 可视 化角度 , 提 出的 关于 图的 地学知 识表 达、 获取 及其 图的地 学问 题解求 证的 理论 方法 模式 , 它 与 地 学 可 视 化 有 着 密 切的联 系, 是地 学可 视化 研究的 高一 级发 展阶段 。基 于计 算机 的地 学多维 图解 以地 学可 视化 为基础 ,结 合地 学专 家知 识库、 推理 机 , 高效的 人机 交互 方式 等来 帮助地 学专 家获 取对 某一 问题的 科学 认识 。 地学 多维 图解的 研究 涉 及地学 图形 思维 , 地 理空 间认知 , 图 解规 则获 取, 地学知 识表 达及 推理 , 与 地学可 视化 技术 和系统的融合等。 如果把 地学 可视 化 、 地 学 多 维图解 中的 高效 人机 交互 方式发 展为 虚拟 现实 技术 中的融 入 沉浸方 式以 及多 感觉 交互 方式 ,再 加上 网络 连接 技 术 等 , 那 么 就 产 生 虚 拟 地 理环境 ( VGE, Virtual Geographic Environment) 。 VGE 是地 学可 视化、 地学 多维 图解 等发 展的 最 后集成 系统 , 作为一个基于计算机的地学虚拟实验室,它对地学的发展有着非常重要的意义。虚拟地理环 境的研究内容包括 GIS 数据模型,三维、时空多维大数据量的实时动态交互,网络虚拟现 实构模语言( VRML)及其他网络开发工具如 Java, ActiveX 等的运用等等,它们也是数字 地球技术的基础。 吾尝跂而望矣,不如登高之博见也。 荀子 第十二章 3S 集成技术 导读:本章简介了遥感和全球定位系统技术的基本概念以及它们与GIS的集成应用。 作为实时、客观获取空间信息的新兴技术手段,遥感和全球定位系统成为地理信息 系统的重要数据来源,而通过GIS对其获得的数据进行处理和分析,可以提取各种 有用信息,以进行决策支持。 本章主要介绍了一些3S集成的具体应用,并简要描述了其技术实现方案。 1.遥感简介 遥感 (Remote Sensing),通常是指通过某种传感器装 置,在不与研究对象直接 接触的情 况下,获得其特征信息,并对这些信息进行提取、加工、表达和应用的一门科学技术。 作为一 个术 语, 遥感 出现 于 1962 年, 而遥 感技 术在 世界范 围内 迅速 的发 展和 广泛的 使 用,是 在 1972 年美 国第 一 颗地球 资源 技术 卫星 (LANDSAT-1)成功 发射 并获 取了 大量的 卫星 图像之 后。 近年 来, 随着 地 理信息 系统 技术 的发 展, 遥感技 术与 之紧 密结 合, 发展更 加迅 猛 。 遥感技 术的 基础 , 是 通 过 观测电 磁波 , 从 而 判 读 和 分析地 表的 目标 以及 现象 , 其 中利 用 了地物 的电 磁波 特性 , 即 “一 切物 体, 由于 其种 类 及环境 条件 不同 , 因而具 有反射 或辐 射不 同波长 电磁 波的 特性 ” (图 12-1) , 所以 遥感 也可 以 说是一 种利 用物 体反 射或 辐射电 磁波 的固 有特性,通过观测电磁波,识别物体以及物体存在环境条件的技术。 图 12-1:几种常见地物(水、绿色植被、裸旱地)的电磁波反射曲线 在遥感 技术 中, 接收 从目 标反射 或辐 射电 磁波 的装 置叫做 遥感 器( Remote Sensor) ,而 搭载这 些遥 感器 的移 动体 叫做遥 感平 台 ( Platform) , 包 括飞 机、 人造 卫星 等, 甚至地 面观 测 车也属 于遥 感平 台。 通常 称用机 载平 台的 为航 空遥 感 ( Aerial Remote Sensing) , 而 用星 载平 台的称为航天遥感。 按照遥 感器 的工 作原 理, 可以将 遥感 分为 被动 式遥 感 ( Passive Remote Sensing)和 主 动 式遥感 ( Active Remote Sensing)两 种, 而每 种方 式 又分为 扫描 方式 和非 扫描 方式, 其中 陆 地卫星 使用 的 MSS( Multispectral Scanner)和 TM( Thematic Mapper) 属于被 动式 、 扫描方 式的 遥感 器( 图 12-2) ,而 合成 孔径 雷达 (SAR-Synthetic Aperture Radar)属于 主 动式、 扫描方式的遥感器。 图 12-2:多光谱扫描仪示意图 [Curran] 从遥感 的定 义中 可以 看出, 首先, 遥感 器不 与研 究对 象直 接 接 触 , 也就 是说 , 这里的 “遥” 并非指“遥 远” ;其 次,遥 感的目的是 为了得 到研究 对象的特 征信息; 最后, 通过传感 器装 置得到 的数 据, 在被 使用 之前, 还要 经过 一个 处理 过程。 图 12-3 描述了 从获 取遥感 数据 到 应用的过程。 目标物 的电 磁波 特征 影响因 子 遥感器 数据 采集 信息提 取 应用 农林 地质 水文 海洋 气象 环境 等 计算机 数据处 理 及 人工图 像 判读 图像数据 波段 太阳位 置 大气状 态 气象 季节 地表状 态 遥感器 性能 遥感器 位置 电磁能量 (E) 波长 (λ ) 图 12-3:遥感数据过程 遥感数 据的 处理 —— 通常 是图像 形式 的遥 感数 据的 处理 , 主 要包 括纠 正 ( 包括 辐射纠 正 和几何纠正 ) 、增强 、变换 、滤波、分 类等功 能,其 目的主要 是为了提 取各种 专题信息 ,如 土地建 设情 况、 植被 覆盖 率、 农 作 物 产 量 和 水 深 等 等 (图 12-4)。 遥 感图 像处 理 可以采 取光 学 处理和 数字 处理 两种 方式 ,数字 图像 处理 由于 其可 重复性 好、 便于 与 GIS 结 合等特 点, 目 前被广泛采用。下面简单介绍数字图像处理的主要功能。 图 12-4:武汉市东湖附近 TM 合成图像,长江上的轮船清晰可见 (合成方案: R=TM7, G=TM4, B=TM2,经增强处理) 1)图像纠正 图像纠 正是 消除 图像 畸变 的过程 , 包 括 辐 射 纠 正 和 几何纠 正 。 辐 射 畸 变 通 常 由于太 阳位 置, 大气 的吸 收、 散射 引 起 ; 而 几 何 畸 变 ( 图 12-5) 的 原因 则包 括遥 感平 台 的速度 、 姿 态 变 化, 传 感 器 , 地 形 起 伏 等 , 几何纠 正包 括粗 纠正 和精 纠正两 种, 前者 根据 有关 参数进 行纠 正; 而后者通过采集地面控制点( GCPs, Ground Control Points) ,建立纠正多项式,进行纠正。 图 12-5:遥感图像几何畸变的各种情形 [Lillesand and Kiefer] 2)增强 增强的 目的 是为 了改 善图 像的视 觉效 果 , 并 没 有 增 加信息 量 , 包 括 亮 度 、 对 比度变 化以 及直方图变换等。 3)滤波 滤波分 为低 通滤 波 、 高 通 滤波和 带通 滤波 等 , 低 通 滤波可 以去 除图 像中 的噪 声, 而高 通 滤波则 用于 提取 一些 线性 信息, 如道 路, 区域 边界 等。 滤波 可以 在空 域上 采用 滤 波模板 操作 , 也可以在频域中进行直接运算。 4)变换 包括主成分分析(Principal Component Analyst) ,色度变换以及傅立叶变换等,还包括一 些针对遥感图像的特定变换,如缨帽变换。 5)分类 利用遥感图像的主要目的是为了提取各种信息,一些特定的变换可以用于提取信息,但 是最主要的手段则是通过遥感图像分类(Classification) 。计算机分类的基本原理是计算图像 上每个象元的灰度特征,根据不同的准则,进行分类。遥感图像分类有两类方法,即监督分 类(Supervised Classification) 和非监督分类(Unsupervised Classification) ,前者需要事先确定各 个类别及其训练区(Training Area) ,并计算训练区象元灰度统计特征,然后将其它象元归并 到不同类别;后者则直接根据象元灰度特征之间的相似和相异程度进行合并和区分,形成不 同的类别。典型的监督分类算法有最小距离法、最大似然法、平行六面体法等;而 K-均值 聚类属于非监督分类;将人工神经网络( ANN, Artificial Neural Network)应用于遥感分类, 在有些情况下,可以达到较好的分类效果。 遥感的出现,扩展了人类对于其生存环境的认识能力,较之于传统的野外测量和野外观 测得到的数据,遥感技术具有以下优点: g108g32增大了观测范围; g108g32能够提供大范围的瞬间静态图像,用于监测动态变化的现象; g108g32能够进行大面积重复观测,即使是人类难以到达的偏远地区; g108g32大大“加宽”了的人眼所能观察的光谱范围,遥感使用的电磁波波段从 X 光到微 波,远远超出了可见光范围;而雷达遥感由于使用微波,可以不受制于昼夜、天气 变化,进行全天候的观测; g108g32空间详细程度高,航空相片的空间分辨率可以高达厘米级甚至毫米级。 与航空遥感相比,航天遥感能够进行连续的、全天候的工作,提供更大范围的数据,其 成本更低,是获取遥感数据的主要方式;而航空遥感主要应用于临时性的、紧急的观测任务 以获得高精度数据。目前,世界上许多国家都已经发射了服务于不同目的的各种遥感卫星, 其遥感器的空间分辨率和光谱分辨率也都各异,形成了从粗到细的对地观测数据源系列,可 以用于监测从土地利用、农作物生长、植被覆盖到洪水、森林火灾、污染等现象的信息以及 其动态变化。 总之,利用遥感技术,可以更加迅速、更加客观地监测环境信息;同时,由于遥感数据 的空间分布特性,可以作为地理信息系统的一个重要的数据源,以实时更新空间数据库。 表 12-1:几种常用的遥感卫星及其遥感器参数 卫星传感器 波段( μ m) 空间分辨率 覆盖范围 周期 主要用途 Landsat TM 0.45-0.52 0.52-0.60 0.63-0.69 0.76-0.90 1.55-1.75 10.4-12.4 2.05-2.35 30m(1-5,7 波 段) 185km× 185km 16 天 水深、水色 水色、植被 叶绿素、居住区 植物长势 土壤和植物水分 云及地表温度 岩石类型 SPOT-HRV 0.50-0.59 0.61-0.68 0.79-0.89 0.51-0.73 20m 20m 20m 10m 60km× 60km 26 天 水色、植物状况 叶绿素、居住区 植物长势 制图 NOAA-VHR R 0.58-0.68 0.72-1.10 1.1km 2400km × 0.5 天 植物、云、冰雪 植物、水陆分界 3.55-3.93 10.3-11.3 11.5-12.5 2400km 热点、夜间云 云及地表温度 大气及地表温度 IKONOS * 0.45-0.9 0.45-0.52 0.52-0.60 0.63-0.69 0.76-0.90 0.82m 4m 4m 4m 4m 11km× 11km 14 天 2.全球定位系统简介 全球定位系统(GPS, Global Positioning System) 是利用人造地球卫星进行点位测量导航 技术的一种,其它的卫星定位导航系统有俄罗斯的 GLONASS,欧洲空间局的 NAVSAT,国 际移动卫星组织的 INMARSAT 等等。 GPS 全称是 NAVSTAR(NAVigation Satellite Timing And Ranging)/GPS,由美国军方组织研制建立,从 1973 年开始实施,到九十年代初完成。 2.1 GPS 系统介绍 GPS 系统包括三大部分:空间部分——GPS 卫星星座;地面控制部分——地面监控系 统;用户设备部分——GPS 信号接收机。 2.1.1 GPS 卫星及其星座 GPS 由 21 颗工作卫星和 3 颗备用卫星组成,它们均匀分布在六个相互夹角为 60 度的轨 道平面内,即每个轨道上有四颗卫星。卫星高度离地面约 20000 公里,绕地球运行一周的时 间是 12 恒星时,即一天绕地球两周。 GPS 卫星用 L 波段两种频率的无线电波(1575.42MHz 和 1227.6MHz)向用户发射导航定位信号,同时接收地面发送的导航电文以及调度命令。 2.1.2地面控制系统 对于导航定位而言, GPS 卫星是一动态已知点,而卫星的位置是依据卫星发射的星历— —描述卫星运动及其轨道的参数——计算得到的。每颗 GPS 卫星播发的星历是由地面监控 系统提供的,同时卫星设备的工作监测以及卫星轨道的控制,都由地面控制系统完成。 GPS 卫星的地面控制站系统包括位于美国科罗拉多的主控站以及分布全球的三个注入 站和五个监测站组成,实现对 GPS 卫星运行的监控。 2.1.3 GPS 信号接收机 GPS 信号接收机(图 12-6)的任务是,捕获 GPS 卫星发射的信号,并进行处理,根据 信号到达接收机的时间,确定接收机到卫星的距离。如果计算出四颗或者更多卫星到接收机 * IKONOS卫星于 1999 年发射成功,其提供的高分辨率遥感数据具有良好的应用前景。相关信息来自 http://www.spaceimage.com。 的距离,再参照卫星的位置,就可以确定出接收机在三维空间中的位置。 图 12-6: GARMIN 手持式 GPS 接收机 2. 2 GPS 定位基本原理 GPS 定位 基本 原理 是利 用 测距交 会确 定点 位。 如图 12-7 所示,一 颗卫 星信 号 传播到 接 收机的 时间 只能 决定 该卫 星到接 收机 的距 离 , 但 并 不能确 定接 收机 相对 于卫 星的方 向 , 在 三 维空间 中, GPS 接 收 机 的 可能位 置构 成一 个球 面; 当测到 两颗 卫星 的距 离时 , 接 收 机的可 能 位置被 确定 于两 个球 面相 交构成 的圆 上 ; 当 得 到 第 三颗卫 星的 距离 后 , 球 面 与圆相 交得 到两 个可能 的点; 第四 颗卫 星 用于确 定接 收机 的准 确位 置。 因 此 , 如 果接 收机能 够 得到四 颗 GPS 卫 星 的 信 号 , 就 可以 进行定 位; 当接 收到 信号 的卫星 数 目 多 于 四 个时, 可以优 选 四 颗 卫 星 计 算位置。 D1 D2 D3 准确位 置 图 12-7:测距交会定位示意图 2.3 GPS 误差和纠正 造成 GPS 定 位 误 差 的 因 素 有很多 ,如 由于 卫星 轨道 变化以 及卫 星电 子钟 不准 确以及 定 位信号穿越电离层和地表对流层时速度的变化等引起的误差,但是 GPS 定位中最为严重的 误差则是由于美国军方人为降低信号质量造成的,这种误差可高达 100 米。 美国为了防止未经许可的用户把 GPS用于军事目的,实施了各种技术。首先GPS 卫星发 射的无线电信号包括两种不同的测距码,即 P码(也称精码)和 C/A码(也称粗码) ,相应两 种测距码 GPS提供两种定位服务方式,即精密定位服务(PPS) 和标准定位服务(SPS) ,前者的 服务对象主要是美国军事部门和其它特许部门,后者则服务于广大民间用户。此外,通过使 用SA (Selective Availability ,选择可用性)技术, C/A码的定位精度从 20 米降低至 100 米 * ; 而AS(Anti-spoofing ,反电子欺骗 )技术用于对P 码进行加密,当实施AS 时,非特许用户不能 得到P 码。 上述的人为误差给 GPS 的民用造成了障碍,但是可以通过差分纠正来消除。差分纠正 是通过两个或者更多的 GPS 接收机完成的,其方法是在某一已知位置,安置一台接收机作 为基准站接收卫星信号,然后在其它位置用另一台接收机接收信号,由前者可以确定卫星信 号中包含的人为干扰信号,而在后者接收到的信号中减去这些干扰,即可以大大降低 GPS 的定位误差。 3.GIS 与遥感的集成及具体技术 简而言之,地理信息系统是用于分析和显示空间数据的系统,而遥感影象是空间数据的 一种形式,类似于 GIS 中的栅格数据。因而,很容易在数据层次上实现地理信息系统与遥 感的集成,但是实际上,遥感图像的处理和 GIS 中栅格数据的分析具有较大的差异,遥感 图像处理的目的是为了提取各种专题信息,其中的一些处理功能,如图像增强、滤波、分类 以及一些特定的变换处理(如陆地卫星影象的 KT 变换)等,并不适用于 GIS 中的栅格空间 分析,目前大多数 GIS 软件也没有提供完善的遥感数据处理功能,而遥感图像处理软件又 不能很好地处理 GIS 数据,这需要实现集成的 GIS。 在软件实现上,GIS 与遥感的集成,可以有以下三个不同的层次[Ehlers]: g108g32分离的数据库,通过文件转换工具在不同系统之间传输文件; g108g32两个软件模块具有一致的用户界面和同步的显示; g108g32集成的最高目的是实现单一的、提供了图像处理功能的 GIS 软件系统。 在一个遥感和地理信息系统的集成系统中,遥感数据是 GIS 的重要信息来源,而 GIS 则可以作为遥感图像解译的强有力的辅助工具,具体而言,有以下的应用方面[J. C. Hinton] : 1) GIS 作为图像处理工具 将 GIS 作为遥感图像的处理工具,可以在以下几个方面增强标准的图像处理功能: 1.1)几何纠正和辐射纠正 在遥感图像的实际应用中,需要首先将其转换到某个地理坐标系下,即进行几何纠正。 通常几何纠正的方法是利用采集地面控制点建立多项式拟合公式,它们可以从 GIS 的矢量 数据库中抽取出来,然后确定每个点在图像上对应的坐标,并建立纠正公式。在纠正完成后, 可以将矢量点叠加在图像上,以判断纠正的效果。为了完成上述功能,需要系统能够综合处 理栅格和矢量数据。 一些遥感影象,会因为地形的影响而产生几何畸变,如侧视雷达( Dideways-looking radar)图像的叠掩( Layover) 、阴影( Shadow)、前向压缩(Foreshortening )等等,进行纠 正、解译时需要使用 DEM 数据以消除畸变。此外,由于地形起伏引起光照的变化,也会在 遥感图像上表现出来,如阴坡和阳坡的亮度差别,可以利用 DEM 进行辐射纠正,提高图像 * 美国已于 2000 年 5 月取消SA 政策,使得单点定位精度可以达到 20-30 米。 分类的精度。 1.2)图像分类 对于遥感图像分类,与 GIS 集成最明显的好处是训练区的选择,通过矢量/ 栅格的综合 查询,可以计算多边形区域的图像统计特征,评判分类效果,进而改善分类方法。 此外,在图像分类中,可以将矢量数据栅格化,并作为“遥感影象”参与分类,可以提 高分类精度,例如,考虑到植被的垂直分带特性,在进行山区的植被分类时,可以结合 DEM, 将其作为一个分类变量。 1. 3)感兴趣区域的选取 在一些遥感图像处理中,常常需要只对某一区域进行运算,以提取某些特征,这需要栅 格数据和矢量数据之间的相交运算。 2) 遥感数据作为 GIS 的信息来源 数据是 GIS 中最为重要的成分,而遥感提供了廉价的、准确的、实时的数据,目前如 何从遥感数据中自动获取地理信息依然是一个重要的研究课题,包括: 2.1)线以及其它地物要素的提取 在图像处理中,有许多边缘检测(Edge Detection )滤波算子,可以用于提取区域的边 界(如水陆边界)以及线形地物(如道路、断层等) ,其结果可以用于更新现有的 GIS 数据 库,该过程类似于扫描图像的矢量化。 2.2)DEM 数据的生成 利用航空立体像对(Stereo Images) 以及雷达影象,可以生成较高精度的 DEM 数据。 2.3)土地利用变化以及地图更新 利用遥感数据更新空间数据库,最直接的方式就是将纠正后遥感图像作为背景底图,并 根据其进行矢量数据的编辑修改。而对遥感图像数据进行分类,得到的结果可以添加到 GIS 数据库中。因为图像分类结果是栅格数据,所以通常要进行栅格转矢量运算;如果不进行转 换,可以直接利用栅格数据进行进一步的分析,则需要系统提供栅格/ 矢量相交检索功能。 因为遥感图像可以视为一种特殊的栅格数据,所以不难实现遥感和 GIS 的集成的工具 软件——关键是提供非常方便的栅格/ 矢量数据相互操作和相互转换功能,但是要注意的是, 由于各种因素的影响,使得从遥感数据中提取的信息不是绝对准确的,在通常的土地利用分 类中, 90%的分类精度就是相当可观的结果,因而需要野外实际的考察验证——在这个过程 中可以使用 GPS 进行定位。此外,还要考虑尺度问题,即遥感影象空间分辨率和 GIS 数据 比例尺的对应关系,例如在实践中,一个常见的问题是:地面分辨率为 30 米的 TM 数据, 进行几何纠正时,需要多大比例尺的地形图以采集地面控制点坐标,而其分类结果可以用来 更新多大比例尺的土地利用数据,根据经验,合适的比例尺为 1: 5 万到 1: 10 万,太大则 遥感数据精度不够,过小则是对遥感数据的“浪费”。 4.GIS 与全球定位系统的集成及具体技术 作为实时提供空间定位数据的技术,GPS可以与地理信息系统进行集成,以实现不同的 具体应用目标: 1)定位 主要在诸如旅游、探险等需要室外动态定位信息的活动中使用。如果不与GIS集成,利 用GPS接收机和纸质地形图,也可以实现空间定位;但是通过将GPS接收机连接在安装GIS 软件和该地区空间数据的便携式计算机上,可以方便地显示GPS接收机所在位置并实时显示 其运动轨迹,进而可以利用GIS提供的空间检索功能,得到定位点周围的信息,从而实现决 策支持。 2)测量 主要应 用于 土地 管理 、 城 市规划 等领 域, 利用 GPS和 GIS的集 成, 可以 测量 区域的 面积 或者路 径的 长度 。该 过程 类似于 利用 数字 化仪 进行 数据录 入, 需要 跟踪 多边 形边界 或路 径 , 采集抽样后的顶点坐标,并将坐标数据通过 GIS记录,然后计算相关的面积或长度数据。 在进 行 GPS测量 时, 要 注 意以下 一些 问题, 首先, 要确 定 GPS的定 位精 度是 否满足 测量 的 精 度 要 求 , 如 对宅 基地的 测 量 , 精 度需 要达 到厘米 级, 而要 在野 外测 量一个 较 大 区 域 的 面 积, 米级 甚至 几十 米级的 精度就 可以 满足 要求 ; 其 次, 对不 规则 区域 或者路 径的测 量 , 需 要 确定采样原则,采样点选取的不同,会影响到最后的测量结果。 3)监控导航 用于车 辆、 船只 的动 态监 控, 在 接 收 到 车 辆 、 船 只 发回的 位置 数据 后, 监控 中心可 以确 定车船 的运 行轨 迹 , 进 而 利 用 GIS空 间 分 析 工 具 , 判断其 运行 是否 正常 , 如 是否偏 离预 定的 路线 , 速 度是否 异常 ( 静 止 ) 等 等 , 在 出 现 异 常 时 , 监 控 中 心可以 提出 相应 的处理 措施 , 其 中包括向车船发布导航指令。 地理信息系统 GPS 接收 机 数据接 口 数据处 理 显示 测量 监控导 航 数据记 录 定位 图 12-8:GIS 与 GPS集成的系统结构模型 图 12-8 描 述 了 GIS 与 GPS 集 成的 系统 结构 模型 ,为 了 实现与 GPS 的 集 成 ,GI S 系 统 必 须能够 接 收 GPS 接 收机 发 送 的 GPS 数据 (一 般是 通 过串口 通信 ) ,然 后对 数据进 行 处 理 , 如 通过投 影变 换将 经纬 度坐 标转换 为 GIS数 据 所 采 用 的参照 系中 的坐 标 , 最 后 进 行各种 分析 运 算,其中坐标数据的动态显示以及数据存储是其基本功能。 5.3S 集成综述 3S技术 为科 学研 究、 政府 管理、 社会 生产 提供 了新 一代的 观测 手段 、 描 述语 言和思 维工 具 。 3S的结 合应 用, 取长补 短, 是一 个自 然的 发展趋 势, 三者 之间 的相 互作用 形 成 了 “ 一个 大脑,两只 眼睛” 的框架 ,即RS和G PS向GI S提供或 更新区域信 息以及 空间定 位,GIS进 行相 应的空 间分 析 (图1 2-9) , 以从RS 和GP S提 供的 浩如 烟 海的数 据中 提取 有用 信息 , 并 进行 综合 集成,使之成为决策的科学依据。 图12-9:3S的相互作用与集成[邬伦] GIS、 RS和GP S三 者集 成利 用, 构 成 为 整 体 的 、 实 时 的和动 态的 对地 观测 、 分 析和应 用的 运行系统, 提高了 GIS的 应 用效率。在 实际的 应用中 ,较为常见 的是3S 两两之 间的集成, 如 GIS/RS集成,G IS/GPS集成 或者RS/ GPS集成 等,但是 同时集成并 使用3S技 术的 应用实例则 较 少。美国O hio大 学与公路 管理部门合 作研制 的测绘 车是一个典 型的3S 集成应 用,它将G PS接 收机结 合一 台立 体视 觉系 统载于 车上 , 在公 路上 行驶 以取得 公路 以及 两旁 的环 境数据 并立 即 自动整 理存 储于 GIS数据 库 中 。 测 绘 车 上 安 装 的 立 体 视觉系 统包 括有 两个 CCD摄 象 机 , 在 行 进 时,每秒曝光一次,获取并存储一对影象,并作实时自动处理。 RS、GIS 、GPS 集成的 方式 可以在不 同的技 术水平 上 实现,最 简单的 办法是 三 种系统 分 开而由 用户 综合 使用 , 进 一步是 三者 有共 同的 界面 , 做 到表 面上 无缝 的集 成 , 数 据 传 输 则 在 内部通过特征码相结合,最好的办法是整体的集成,成为统一的系统。 单纯从 软件 实现 的角 度来 看,开 发 3S 集 成 的 系 统 在 技术上 并没 有多 大的 障碍 。目前 一 般工具 软件 的实 现技 术方 案是 : 通 过 支 持 栅 格 数 据 类 型及相 关的 处理 分析 操作 以实现 与遥 感 的集成 ,而 通过 增加 一个 动态矢 量图 层以 与 GPS 集 成。对 于 3S 集 成技 术而 言 ,最重 要的 是 在应用 中综 合使 用遥 感以 及全球 定位 系统 , 利 用 其 实 时 、 准 确 获 取 数 据 的 能 力 , 降 低 应 用 成 本或者实现一些新的应用。 3S集成 技术 的发 展 , 形 成 了 综合的 、 完整 的对 地观 测系 统, 提高 了人 类认 识地 球的 能力; 相应地 , 它 拓 展 了 传 统 测 绘科学 的研 究领 域 。 作 为 地理学 的一 个分 支学 科 , Geomatics * 产生 并对包 括遥 感 、 全 球 定 位 系统在 内的 现代 测绘 技术 的综合 应用 进行 探讨 和研 究。 同时 , 它 也 推动了 其它 一些 相联 系的 学科的 发展 , 如 地 球信息 科学 、 地 理信 息科 学等 , 它们成 为 “ 数 字 地球”这一概念提出的理论基础。 * Geomatics以及其它学科的介绍见“地球信息科学与数字地球”一章。 网络就是计算机。 Sun Microsystem Corp. 第十三章 网络地理信息系统 导读:本章首先介绍了计算机网络的基本知识,包括定义、拓扑结构、分类、网络 协议等,然后介绍了因特网以及目前流行的WWW和HTML语言。 第二节讲述了基于网络的分布计算以及地理信息系统在分布计算环境下的具体实现 方案。 第三节主要介绍了在Web上发布空间数据,即实现WebGIS的几种技术方案,并进 行了比较。 1.计算机网络技术 1. 1 网络的基本概念 1. 1. 1 定义 计算机网络( Computer Network)是指实现计算机之间通讯的软件和硬件系统的统称, 从广义上讲,利用磁盘在两台微机之间拷贝数据也可以认为是一种特殊的网络。它的更加具 体的定义是“以共享资源为目的,通过数据通讯线路将多台计算机互联而组成的系统” ,共 享的资源包括计算机网络中的硬件设备、软件或者数据。 1. 1. 2 网络拓扑结构和分类 计算机网络中,网络结点(Node) 计算机或者终端的连接方式称为网络的拓扑结构,它影 响着网络的设计、 功能、 可靠性以及通讯费用等方面,常见的拓扑结构有以下类型: (图 13-1) g108g32星形拓扑结构; g108g32总线拓扑结构; g108g32环形拓扑结构; g108g32树形拓扑; g108g32完全连接结构; g108g32相交环形; g108g32不规则拓扑结构等等。 Computer Cable (1) (2) Cable 图 13-1:网络拓扑结构(A. S. Tanenbaum) ( 1)总线结构, ( 2)环形结构, ( 3)星形结构, ( 4)树形结构, ( 5)完全连接, ( 6)相交环形, ( 7)不规则拓扑结构 计算机 网络 的种 类繁 多, 性能各 异, 按照 不同 的原 则可以 有不 同的 分类 方式 , 最 常 见 的 是根 据其空间 分布范围的大 小,区分 为局域网 (LAN-Local Area Network)、城域 网 (MAN-Metropolitan Area Network)和广域网 (WAN-Wide Area Network)。 1)局域网 是指在 比较 小的 区域 —— 如一座 办公 大楼, 一个 校园 , 一个公 司等 内建 立的 计算 机网络 , 其通讯 距离 较短 , 传 输速 率较快 , 误 码率 低。 对于 局域网 而言 , 主 要采 用的 拓扑结 构是 总线 结构和 环形 结构 ,前 者如 IEEE 802.3,通 常称 为 Ethernet TM (以太网 ),后 者如 IEEE 802.5,即 IBM的令牌环网 (Token Ring)。 2)城域网 基本上 是一 个大 的局 域网 , 采用类 似的 拓扑 结构 , 它可 以覆盖 一个 城市 , 实现 信息 共享 。 3)广域网 广域网 最根 本的 特点 是其 机器分 布范 围广 , 可 以实 现大范 围的 信息 共享 , 笼 统地讲 , 因 特网 (Internet)就属于 广域 网范畴 。 广 域网 可以 采用 多种拓 扑结 构, 如星 形, 环形, 树型 , 完 全连接,相交环形,甚至是不规则的拓扑结构。 上述的网 络类型, 结点之 间都是通 过电缆 进行连接 ,近年来 无线网 (Wireless Network) 得到较快的发展,利用无线网,可以实现移动计算。 1. 2 因特网(Internet) 因特网是指全球最大的、开放的、由众多网络相互连接而成的计算机网络,其形成和发 展无疑是信息技术发展过程中最为激动人心的事情,目前大专院校,大学,政府部门,图书 馆,企业以及个人都已经连接到因特网,它允许网络使用者在任何时间、任何地点查阅任何 网络上的信息,它给信息传播带来了巨大便利,它正在改变着整个人类社会的生活方式。 1. 2. 1 因特网发展历史 因特网的前身是 1965 年开始由美国国防部设计的 ARPA(Advanced Research Project Agency)net。经过周密的策划,1969 年,分布于美国四所大学(UCLA,UCSB,SRI,UTAH ) 的计算机开始进行互相数据交换,标志着 ARPAnet 的诞生,后来,特别是 1983 年 TCP/IP 协议被正式应用于 ARPAnet 之后,其接入用户飞速增长。 由于 ARPAnet 的军方背景,给更加便捷的连入和访问造成不便,于是 NSF(National Science Foundation)建立了 NSFnet,其管理和速度都优越于 ARPAnet,到 1990 年,很多用 户从 ARPAnet 转到 NSFnet,后来 NSFnet 与 ARPAnet 互连,其用户成指数增长。许多地区 性(包括加拿大、欧洲、大洋州等)的网络联入后,标志着 Internet 的最终形成。 1. 2. 2 因特网提供的应用服务 在传统上,因特网主要有以下四种应用: g108g32电子邮件(Electronic Mail) ; g108g32新闻组(News); g108g32远程登录; g108g32文件传输。 直到八十年代初期,因特网还只是局限于学院、 政府等等,但是 WWW(World Wide Web) 的出现改变了这一切, WWW 使得一个站点可以建立一些包括文本、图片、声音甚至录象 的页面,这些页面用超文本标志语言(HTML-Hyper Text Markup Language) 写成,内嵌指向其 它页面的链接。 WWW 为用户查询、检索、浏览在因特网上发布的各种信息提供了极大的 便利,为因特网带来了大量的非学院用户。实际上因特网的迅猛发展,与 WWW 应用是密 不可分的,以至于今天提到 Internet 时常常就是特指 WWW 服务。后面将对 WWW 以及相 关技术进行更为详细的说明。 其它一些因特网应用包括 Gopher,WAIS 等等。 1. 2. 3 网络协议(Protocol) 和 TCP/IP 在计算机网络中,为了使得相连的计算机或终端之间能够正确的传输信息,必须有一整 套关于信息传输顺序、信息格式以及内容的约定,称为计算机网络通讯协议。 在网络协议中,由国际标准化组织(ISO) 发展和制定开放系统互连参考模型( OSI, Open System Interconnect Reference Model)制订了数据通讯协议的标准,尽管 OSI 模型并没有真 正地在实际中被应用,但是其提供的概念和词汇被计算机网络界广泛地使用和认可。 OSI 参考模型包括七个协议层来定义数据通讯的协议功能,每一层是相对独立的,完成数据传输 过程中的部分功能。 目前, 由于 因特 网的 发展 , TCP/IP 作 为 其 基 础 协 议 ,应用 越来 越广 泛。 TCP/IP 狭义 特 指两个协议及传输控 制协 议 (TCP, Transformation Control Protocol)和网际协议 (IP, Internet Protocol), 广 义指 由多 个与因 特 网 相 关 的 协 议 组成的 TCP/IP 参考 模 型 , 或 者称为 TCP/IP 协 议栈 (Protocol Stack), TCP/IP 模型 类似 于 OSI 参 考模型 , 但 是较 为简 单, 没 有 表 示 层 和 会 话 层。 TCP 及 IP 是其中重要的两个协议, IP 是网络层协议,而 TCP 位于传输层。 TCP/IP 应用 层包括所有高 层应用协议,如虚拟终端 ( TELNET) 、文件传输 (FTP, File Transfer Protocol)、电子 邮件 (SMTP, Simple Mail Transfer Protocol 和 POP3-PostOffice Protocol)、 域 名服 务 (DNS, Domain Name Service)以及 Web 上 用 来 传递页 面的 超文本 传输 协 议 (HTTP, Hyper Text Transfer Protocol)。 OSI 参考模型结构及其和 TCP/IP 参考模型的对应关系如图 13-2: 应用层 表示层 会话层 传输层 网络层 数据链 路层 物理层 应用层 传输层 Internet 层 主机到 网络 模型中无 该层 图 13-2: OSI 参考模型和 TCP/IP 参考模型 1. 2. 4 因特网的地址、域名 为了能 够在 因特 网上 传输 信息, 必须 有一 种方 法能 够识别 计算 机, 其方 案是 为因特 网上 的每一 台计 算机 都赋 予了 一个独 一无 二的 32 位地 址 ,称为 IP 地址 ,该 32 位 地址通 采用 用 点号分 割的 十进 制数 表示 , 每 个 字 节 为 一 个 十 进 制 数值, 其数 值范 围从 0 到 255,这 样 , IP 地址就 表现 为如 下的 形式 : 202.112.7.12(北 京大学 WWW 服务 器 IP 地址 ) 。 在因特 网上 , 计算机 之间 的通 讯是 通过 IP 地址 来进 行的 。由 于因 特网的 迅速 发展 ,有 越来 越多的 计算 机 连入,现有的 32 位 IP 地址已经不太能 够满足其 进一步发展的需 要,因此 , ITEF(Internet Engineering Task Force, 因特网 工程 任务 组 )开 始 制 订更新 的 IP 协议 标准 ,称 为 Ipv6,根据 该标准, IP 地址将采用 16 个字节来标识。 虽然计 算机 之间 的通 讯是 利用其 各自 的 IP地址 来实 现的, 但是 人们 在使 用过 程中, 不愿 意总是 使用 难以 记忆 的数 字, 而 是 希 望 使 用 更 为 方 便的文 字名 称。 这样 网络 上的各 个主 机除 了 IP地 址 之 外 , 通 常 还 有 一 个名称 来表 示。 该名 称称 为域名 ( Domail Name) ,与 IP地址 一样 , 也是唯 一的 。 这 种在 因特 网上使 用的 名称 系统 称为 域名系 统 ( DNS, Domain Name System) 。 DNS是一 个层 次状 的命 名系 统, 通 过 一 个 数 据 库 对 连 接因特 网的 所有 主机 进行 名称和 地址 的 管理。 域名是 以点 号分 割 的字符 串,如 PKU.EDU.CN和 OPENGIS.ORG等等。 通常最 右边 的 字串称为顶级域名,顶级域名有两类,即类顶级域名和国家顶级域名,前者有 com(商业 ), edu(教育 界 ), gov(政府 机构 ), int(特 定的国 际组 织 ) , mil(军 队系 统) , net( 网络提 供者 ) , org(非赢利机构)等,类 顶级域名应用于美国的站点;后者用两个英文字母表示一个国家 和地区,如 cn(中国) , ca(加拿大) , jp(日本)等等。 1. 2. 5WWW、 HTML 和 URL 正如前面描述的,万维网(WWW)的出现对于因特网来说具有划时代的意义,使得因 特网的应用走出专业化。 WWW,通常又称为 Web 或 3W,是存储在全世界的 Internet 计算 机中、彼此关联、数以百万计的文档集合,它是世界上最大的电子信息仓库。在 WWW 应 用中, Web 文档存放于一台或者多台计算机上,称为 Web 服务器 (Web Server),用户利用浏 览器(Browser) 来访问 Web 站点。 Web 的第一个版本于 1992 年 1 月在瑞士的日内瓦首先开始运行,研究人员可以从 CERN(欧洲粒子物理研究所) 的站点上访问 Web 信息。 Web 真正流行应该归功于 Mosaic,第 一个基于图形的浏览器,该浏览器是由 NCSA(美国国家超级计算应用中心) 设计编写的,其 操作简便、界面友好的特点,使得人们可以方便的访问 Web 信息。目前广为流行的浏览器 是 Microsoft Internet Explorer 和 Netscape Navigator。 在 Web 站点上,采用 HTML 编写文档,通常称为超文本(Hyper Text) ,“超”的意思是指 在文档中包含对其它文档的超链接(Hyper Link ),使用户阅读时可以通过关键字跳转到其 它的文档。由于允许在超文本中加入音乐以及图像等多媒体数据,又诞生了超媒体 (Hyper Media)这个概念。 HTML 是一种标记语言,与系统平台和应用程序无关,它通过特殊的标记 和参考字符来设定 Web 文档的结构或者格式,并且有特殊的 HTML 元素(如定位元素 Anchor)来定义超链接,同时可以利用 HTML 表单元素从用户那里获取有关信息。在用户 访问 Web 站点时, 浏览器和 Web 服务器之间通过超文本传输协议 (HTTP)来发送请求和信息。 在浏览 Web 时,首先会碰到 URL(Uniform Resource Locator,统一资源定位器) 这一概念, 它是 Web 文档的因特网地址,它与文档的关系就如同于书籍中目录和正文的关系。 URL 的 语法相当简单,由两部分组成,形如: <方法> :< 方法指定部分> (<scheme>:<scheme-specific-part> ) 一个 HTTP URL 如下: http://<host>:<port>?<search_part> 其中 host 部分由服务器的地址( IP 地址或者域名)、文件路径、文件名组成; port 部分 是 HTTP 端口号,其缺省为 80,通常可以忽略;而 search_part 部分往往是浏览器向服务器 发出的请求参数。下面是一个 HTTP URL 的例子: http://www.pku.edu.cn/news1/index.htm 除了 Web 以外,FTP 、Gopher 等也采用 URL 进行资源定位。 1. 2. 6 企业内部互连网 在九十年代后半段,随着因特网的发展,出现了企业内部互连网( Intranet)这个崭新 的概念,简而言之, Intranet 是企业自己的内部网络,不过这个网络同样采用了基于 Internet 的工具,如 Email, Web 浏览器和文件传输等等,因而使得一个企业内部充分享用因特网的 各种优势,如信息的共享和管理,实时通讯和协作,使用分布式的数据库等等。 2.分布式地理信息系统 随着计算机网络的发展,基于客户机 /服务器体系结构,并在网络支持下的分布式系统 结构已经成为地理信息系统的发展趋势。由于 GIS 的固有的特点,使得运行于网络上的分 布式系统特别适合于构造较大规模的 GIS 应用,其应用表现在以下几个方面: 1)数据的分布:在地理信息系统中,主要数据是空间数据,由于数据生产和更新的要 求,常常需要存放在空间上分离的计算机上。 2)应用功能的分布: GIS 的功能组成了由空间数据录入到输出的一个工作流程,不同 的人员由于其关注的信息不同,需要不同的 GIS 功能服务对数据进行处理,将应用分布在 网络上就可以解决该问题。 3)外设共享:外设的分布是服务分布的一种,由于许多 GIS 外设较为昂贵,如高精度 平板扫描仪,喷墨绘图仪,大幅面数字化仪等,而通过分布式系统,可以实现这些设备的共 享。 4)并行计算:在地理信息系统中,许多模型具有较高的时间复杂性,利用分布系统可 以实现并行计算,缩短计算时间。 下面将描述分布式系统以及一些网络地理信息系统的模式和实现。 2. 1 分布式系统和 C/S 模型 分布式系统(Distributed System)的定义是:一组独立计算机的集合,但是从用户的角 度来看,如同于一台计算机。较之于集中式系统(Centralized System)以及独立的微机系统, 分布式系统具有以下优点(表13-1,表13-2): 表13-1:分布式系统的优势--与集中式系统比较[A. S. Tanenbaum] 项目 描述 经济 多个微处理器提供了更好的性能/价格比 速度 一个分布式系统比大型机有更好的总体计算能力 固有的分布 一些应用系统需要运行于空间上分离的机器 可靠性 如果一台机器崩溃,整个系统还能够运行 增量发展 计算能力能够以很小的增量增长 表13-2:分布式系统的优势--与微机系统比较[A. S. Tanenbaum] 项目 描述 数据共享 允许多个用户访问同一数据库 设备共享 允许多个用户共享昂贵的外设 通讯 使人与人之间的通讯变得简单,如电子邮件 灵活性 以最有效的方式将工作量分布在所有可用的机器上 在具有上述优势的同时,由于分布式系统的复杂性,对软件硬件提出了更高的要求,它 也具有以下不足之处(表13-3): 表13-3:分布式系统的不足之处[A. S. Tanenbaum] 项目 描述 软件 当前支持分布式系统的软件较少 网络 网络可能充满了或者引发其它的错误 安全性 容易使得需要保密的数据被访问 客户机/服务器(C/S,Client/Server)模型是一种分布式系统结构,在该体系中,客户端 通常是同最终用户交互的应用软件系统,而服务器由一组协作的过程构成,为客户端提供服 务。客户机和服务器通常运行相同的微内核,一个客户机 /服务器机制可以有多个客户端, 或者多个服务器,或者兼而有之。客户机 /服务器模式基于简单的请求/ 应答协议,即客户端 向服务器提出信息处理的请求,服务器端接收到请求并将请求解译后,根据请求的内容执行 相应操作,并将操作结果传递回客户端( 图 13-3)。客户机/服务器体系的优点在于简单和高 效。 HTTP、 FTP 等协议都是遵循客户机/ 服务器的模式。在网络地理信息系统的实现中,客 户机 /服务 器模型是经常采用的一种 方案。目前,将服务器分 解形成数据服务器和应用 服务 器, 形成 三层 结构 , 可 以 更 好地区 分数 据访 问操 作和 应用模 型, 这是 经常 被采 用 的一种 结构 。 客户端 服务器 客户端 客户端 服务器 信息请求 图 13-3:客户端-服务器模型 2. 2 网络地理信息系统的组合方式 在分布 式的 网络 地理 信息 系统中 , 客 户 机 和 服 务 器 分别由 相应 的软 件 、 硬 件 以及数 据库 组成,其组合可以按照数据和应用功能的分布分成五种(表 13-4) : 表 13-4:网络信息系统的组合方式 [李斌 ] 组合方式 数据 应用功能 全集中式 中央服务器 中央服务器 数据集中式 中央服务器 客户端 功能集中式 客户端 中央服务器 全分布式 客户端 客户端 函数库分布式 客户端或者服务器 中央服务器存储,客户端动态连接执行 2. 2. 1 全集中式 全集中 式的 地理 信息 系统 把软件 、数 据库 管理 系统 和数据 库全 部集 中在 中央 服务器 上 , 客户系 统只 负责 用户 界面 功能 , 即 获得 用户指 令并 传递给 服务 器 , 显示 查询 结果 , 提 供系 统 的辅助 功能 (图 13-4) 。 常 用的客 户设 置有 三种 , 第 一种是 以 X-server 为 代 表 的 ,只负 责表 现逻辑 的客 户系 统, 所有 的数据 处理 和运 算均 在服 务器上 执行 ,客 户端 由专 门的 X 终端 或 者 X 模拟 器通 过 X 协 议 实 现用户 与服 务器 之间 的通 讯;第 二种 是 以 ArcView 为代表 的客 户 软件 系统,这类系 统除了提供 一般的用户界 面以外,还 具有相当强的 分析和处理 功能。 ArcView 可以与 ESRI 的 ARC/INFO、与作 为服 务器 的 SDE、 Arcstorm,通过 网络软 件系 统 NFS 或者网 络 API 构 成 网 络地理 信息 系统 ;第 三种 是目前 在 WebGIS 上 广 泛 采用的 客户 系 统,用户界面功能由浏览器执行, WebGIS 在后面还将进一步的描述。 应用程 序 服务器 数据管 理 服务器 数据 服务器 Client Client Client Client 图 13-4:全集中式网络信息系统 [李斌 ] 2. 2. 2 数据集中式 网络系 统专 门设 置集 中的 数据存 储和 管理 服务 , 网 络的其 它部 分成 为数 据客 户, 它 们 一 般都是 带有 一定 功能 的地 理信息 系统 软件 ( 图 13-5) 。简单 的数 据服 务可 以由网 络 软 件 系 统 (如 NFS)提 供, 大型的 管理系 统则 需要 功能 完备 和高性 能的 数据 服务 器, 如 Arcstorm 和 Oracle。 由 于 目 前 许 多 数 据 库管理 系统 开始 支持 面向 对象的 数据 模型 , 更 加方 便于空 间数 据 的管理,以建立数据集中式的网络地理信息系统。 (a) (b) 数据服 务器 地理信 息系 统 软件系 统 其它 软件系 统 DBMS 服务 器 地理信 息系 统 软件系 统 其它 软件系 统 图 13-5:数据集中式地理信息系统组合模式 [李斌 ] (a)采用网络文件系统, (b)采用数据库服务器 2. 2. 3 功能集中式 与数据 集中 式相 反 , 功 能 集 中式的 网络 信息 系统 把绝 大部分 的功 能集 中在 一个 或者几 个 容量大 、 性 能 高的服 务器 上, 由它 们负 责所有 的分 析和处 理 , 数 据则分 散到 客户端 存储 和 管 理( 图 13-6) 。 由 于在 大多 数 GIS 应用 中, 数 据 量 一 般 比 较 庞 大 , 采 用这 种方式 , 会 增加 网 络的传输量,从而降低整个系统的性能。 地理信 息系 统服 务器 地理信 息系 统 软件系 统 其它软 件系 统 数据存 储器 数据库 管 理 系统 数据存 储器 数据库 管 理 系统 图 13-6:功能集中式的地理信息系统 [李斌 ] 2. 2. 4 全分布式 全分布 系统 是原 有的 非网 络化的 信息 系统 自然 进化 的结果 。 在 全分 布系 统中, 各个子 系 统具有 完备 的数 据库 及地 理信息 系统 软件 和其 它应 用软件 , 在网 络中 同时 扮演 客户和 服务 器 的角色 。 各 个子 系统 的软 硬件环 境和 特性 及拥 有的 数据都 很可 能不 一样 , 但 同时又 有很 密切 的联系 和互 补性 。系 统的 集成, 通过 网络 操作 系统 及各子 系统 提供 的 API 实现。实 现全 分 布式的 网络 地理 信息 系统 , 往 往 需 要 基 于 已 有 的 系 统平台 进行 二次 开发 , 使 它们能 够相 互协 作。 2. 2. 5 函数库服务器 传统的 软件 系统 一般 是静 态的, 为了 提供 更多 的功 能,系 统变 得越 来越 大, 而实际 上 , 对于每 一个 用户 而言 , 通 常只是 需要 有限 的几 个功 能, 这样 就造 成了系 统资 源的浪 费 。 对 于 集中式 系统 而言 , 系 统的 扩大将 加大 中央 服务 器的 负担 , 造 成系 统性能 下降 , 而 全分 布系 统 实现又 较为 复杂 。 函 数服 务器把 优化 的功 能函 数存 储在服 务器 上, 通过 网络 按用户 要求 动态 合成应 用软 件, 并使 其在 客户机 上运 行。 从而 从根 本上改 变了 传统 的资 源分 配和软 件运 行及 维 护 方式。 基于 分布 构件模 型 ( CORBA 或 DCOM) 构造的 软件 系统 可以 在一 定程度 上实 现 函数库服务器。 2. 3 网络地理信息系统的概念设计 从逻辑 上讲 , 基于 用户 的功 能需求 进行 概念 设计 是大 多数计 算机 网络 软硬 件配 置设计 的 第一步。概念设计应当基于如下要点: g108g32对用户的应用意图有充分的了解; g108g32掌握计算机硬件和计算机通讯的基本概念知识; g108g32了解已经存在的并有可能影响设计的条件,包括现有软件系统以及通讯设施; g108g32对于有可能影响系统设计的计算机技术及其发展的现有状况应有充分认识。 概念设 计应 当对 在地 理信 息系统 网络 配置 中的 硬件 、 软 件 的 功 能 和 作 用 给 予 说明, 并对 设备和 应用 之间 的关 系给 予描述 , 应 当能 够在 网络 系统实 现时 , 有 利于 系统 功能重 新审 核以 及修改 , 有 利 于系统 价值 的估算 , 并 且 为更详 细的 特殊定 义提 供基 础, 同时 还应当 对系 统 能 够在新的应用、新的用户和扩展数据库方面给予描述。 进行网络地理信息系统概念设计时,集中式、分布式和处理功能必须与特定的地址条件、 用户的应用需求相适应。下面给出了一些典型概念设计以及其说明。(表 13-5) 表 13-5:一些网络地理信息系统的概念设计描述 图 示 系统和组织类 型 地址分布 数据传输操作 升级可能性 一 适用于地方政 府、工程单位的 单个部门的少 量用户用于数 据获取、地图生 产 单一地址 与其它已有站点之间 的数据传输没有特殊 的要求,数据可以通 过磁带等介质或者进 行批量传输 可以升级为基于 主机的网络或者 具有其它智能工 作站的网络 二 作为小型多用 户系统,用来支 持数据获取、地 图生产、数据库 和图形查询应 用,服务于政府 机构或企事业 单位的一个或 几个部门 拥有大量外围处 理单元被分配在 一建筑物的一层 或者相邻几层,远 程用户通过拨号 上网与系统连接 其它来源的数据可以 通过磁带等介质或者 直接进行批量传输 一些附加设备可 以添加在异步端 口上,可以升级为 局域网 三 适用于中型到 大型的政府或 企事业单位的 组织结构, 用户 通过进入大型 主机数据库进 行查询、分析和 制图 在同一建筑物内, 多个地址直接相 连; 新增加的工作 站或其它设备可 以通过远程联结 与图形控制器以 及通讯处理器相 连 周期性数据交换可以 通过磁带等介质进 行,也可以利用网关 与其它计算机网络进 行传输,微机数据的 传输容易建立 设备可以灵活增 加以达到大型主 机处理器的计算 容量 四 用于小型到中 型的政府部门 或公司单位 分配于同一建筑 物内 可以通过微机桌面传 输装置或拨号上网来 进行数据交换 增设的微机和服 务器可以容易的 添加到环形网络 上 五 适用于需要大 量制图与地理 分析的中型到 大型的政府、公 共事业和公司 单位组织的多 个分组部门 同一建筑物内或 者临近建筑物之 间的局域网上,其 它用户通过远程 通讯线路与局域 网相连 数据传输在网络上进 行,远程通过批量数 据文件或磁带交换, 也可通过网关连接到 其它网络 局域网可以通过 中继器扩展到更 大的地区,多个局 域网可以通过网 桥连接在一起 六 设置在局域网 上,支持具有主 机处理单元的 多用户,适用于 多部门背景 同一建筑物内或 者临近建筑物之 间的局域网上,其 它用户通过远程 通讯线路与局域 网相连 以主机来维持主数据 库,可以进行批量文 件或磁带的数据传输 可以增加外设,工 作站和处理单元 直至达到网络限 制, 可以通过中继 器扩展其它建筑 物, 多个局域网可 以通过网桥连接 在一起, 可以增加 网关连接多种网 络 七 在局域 网上 配 置多个 处理 单 元和外 设, 以支 持多个 功能 相 关组织 处理 单元 和外 设 分布 在多 个建 筑 物内, 有些 设备 通 过远 程线 路与 局 域网相连 用 户可以 访问局 域网 上 的分布 式数据 ,可 以 通过网 关进行 其它 网 络的批 量或实 时数 据访问 可以增 加外 设, 工 作站 和处 理单 元 直至 达到 网络 限 制, 局域 网扩 展可 以通 过中 继器 或 网桥实现 八 一个系 统网 络 中的多 用户 数 据共享, 或者 是 需要较 大数 据 处理能 力的 具 有地理 分布 的 某个组织 多个 处理 单元 通 过远程线路相连 单 个地址 的数据 更新 以批 量文件方 式进 行 ,多个 地址之 间的 相 互访问 依靠远 程线 路传输 每个 地址 都可 以 扩展, 增加 的处 理 单元 可以 加入 到 远程网络中 图 13-7: (一)拥有外设的超级微机工作站 图 13-8: (二)通过异步线路支持设备的基于主机的集中式系统 网络互连设备简介 1) 中继器 (Repeater): 是 最简 单的网 间连 接器 , 提 供 对 信号的 放大 和转 发 , 它 只 能连接 具有 相同物 理协 议的 LAN。中 继器主 要用 于扩 充 LAN 电缆段 的距 离, 在同 一个 LAN 中, 也可以采用 LAN 延长介质长度。 2) 网桥 (Bridge): 网桥 是在 数 据链路 层实 现 LAN 互连 的 存储转 发设 备 , 它 独 立 于 高层协 议, 可以实现异构型局域网的互连。 3) 路由器 (Router):路由 器工 作在 OSI 模 型 的 网 络 层 , 能够获 得更 多的 网络 信息 ,为来 到 的信息 找到 “最 佳路 由” 。 路 由 器 结 构 比 网 桥 复 杂 , 速度 也慢 , 但 是具 有更 大的灵 活性 和更强的异种网络互连能力。 4) 网关 (Gateway): 又 称 为协议 转 换器, 工作 在 OSI 模型的传 输层 及以 上层 , 用 于互连 不同 体系结 构的 网络 或者 媒体 。 它 不仅 要连 接分 离的 网 络 , 还 必 须 确 保 从 一 个 网 络传输 的数 据与另一个兼容。 图 13-9:(三)通过通讯控制器支持外围设备的基于大型主机的系统 图 13-10:(四)令牌环网络微机系统 图 13-11:(五)局域网上具有超级微机工作站的分布式处理和数据库系统 图 13-12:(六)具有主处理器,超级微机工作站和外设的局域网 图 13-13:(七)具有多处理单元和中央数据存储的局域网 图 13-14:(八)具有分布式数据存储的远程处理 几种局域网技术标准:以太网,令牌环网和 FDDI IEEE(电 气和电子工程师协会 )确定了一 些局域网的标准, 统称 为 IEEE 802,包 括 CSMA/CD(带 有 冲 突 检 测 的载波 侦听 多路 存取 ), 令 牌总线 , 令 牌环, 而 FDDI( Fiber Distributed Data Interface, 光 纤 分 布 式 数据接 口) 应用 于高 速 LAN。 下 面对 几个 常用 的技 术标 准 作 以 简 单介绍。 1) IEEE 802.3: CSMA/CD,采 用 CSMA/CD 在局 域网 中访问 和传 输数 据, 假如 一个节 点要 发出一 条消 息, 那 么 首 先 检查通 信信 道, 看 是 否 正 在进行 数据 传输。 如果 没 有 , 就 可以 使 用 线路, 发送 自己 的消息 , 否 则必 须等 到信 道空闲 。 如 果两 个节 点同 时试图 发 出 消 息 , 就会发生冲突,此时两个节点各自等待随机长度的一段时间,再重发上一条消息。在最 早的 802.3 中,规定传输速率为 10Mbps,使用 50 欧姆的电缆,后来这些都有所改变。 因为其传输电缆的原因,很多人称之为以太网,其电缆有以下几种,如表 13-6。 表 13-6:通常的以太网电缆类型 名称 电缆 最大段长 每段最多节点 好处 10Base5 粗同轴电缆 500 米 100 可以作为骨干线路 10Base2 粗同轴电缆 200 米 30 价格最低廉 10Base-T 双绞线 100 米 1024 易于维护 10Base-F 光纤 2000 米 1024 可以用于建筑之间 2) IEEE 802.4:令牌环网,在令牌环网中,有一个特殊的数据包,称为“令牌”,沿着网络 从一个节点发送到另一个,该令牌包含着特殊的控制信号,使节点能够知道令牌目前是 正携带着一条消息,还是处于空闲状态,可以接收一条消息。如果令牌空闲,同时节点 需要发出一条消息,以“捕获”该令牌,并将自己的消息附加其中,随后该令牌就不能 再携带其它消息,除非将目前的消息“投递”出去。 3) FDDI: FDDI 是高性能的光纤局域网,其传输速率为 100Mbps,传输距离可达 200KM, 其间可以连接 1000 台工作站。 FDDI 的使用类同于 IEEE 802 规范的 LAN。但由于其高 带宽,可以作为连接铜质局域网的骨干网。 3. WebGIS——万维网地理信息系统 3. 1 因特网和 GIS 毋庸置疑,因特网的发展为 GIS 发展带来了极大的便利,同时也 GIS 理论及技术研究 提供了新的领域。作为信息系统以及一门学科, GIS 可以从因特网的发展受到的影响主要有 以下几个方面: 1)GIS 研究者利用新闻组或者电子邮件进行 GIS 技术问题的探讨。 2)网络远程教育,即教授将教案以 HTML文档形式放在网上,学生下载使用,并且可以 利用电子邮件进行提问,这样就形成了“虚拟大学(Virtual University )”。 GIS的教育也可以 以该种方式进行,目前有关GIS 教育网址有,网址 http://giswww.kingston.ac.uk * ,提供了三个 与 GIS有关的专题;网址 http://www.utexas.edu介绍了有关GIS 和地理教学面临的挑战,网址 http://www.census.gov/pub/geo/gis-faq.txt有许多关于GIS 常见问题的问答。 3) GIS 软件的下载, GIS 软件公司可以定期将其开发软件的最新版本放在其站点上,以 供用户下载试用。 典型地理信息系统方面 WWW 网址介绍[ 宫鹏] ( 1) GIS WORLD INC. http://www.gisworld.com 《地理信息系统世界》是目前国际有关 GIS 方面最畅销的杂志,其网址上列出了该公 司出版的任何一期的内容目录,用户还可以利用搜索器进行内容搜索。 ( 2) GIS 软件开发商网址 ESRI 公司( http://www.esri.com), Intergraph 公司 (http://www.intergraph.com), MapInfo 公 司( http://www.mapinfo.com)。 * 本文列出的一些URL 极有可能在读者看到时已经“失效”,这几乎是Web 上司空见惯的事情了。 这些被认为是一流的 GIS 网址,有丰富的 GIS 信息,包括的内容有:公司介绍,产品, 公司出版物,年度报告,会议预报,用户信息,产品订购,技术咨询,程序设计技巧,就业 机会,产品展示和免费软件下载等等。 ( 3)虚拟旅行家网 http://www.vtouris.com 该网址允许用户进行交互的地图显示,首先是世界地图,然后是各国或各地区地图,最 后是城市地图。其地图是栅格图像,利用空间位置实现用户交互操作,有大量的文本、图像 等描述信息供用户查阅。 ( 4)加拿大地球信息科学网 http://abbott.ccm.emr.ca 该网站是一个国家级的对地球信息进行管理的机构,它提供大量的产品和服务,包括加 拿大的卫星图像,国家地图集数据,加拿大地名数据库,地形数据库,道路网络,数字地形 数据等等。此外还提供了获得以上数据的服务,用搜索器得到搜寻地区的数据。 ( 5)填充式数据查询和表达网址 http://tiger.census.gov/cgi-bin/mapbrowse-tbl 该网站采用填充式(fill-in-the-blanks) 的方式进行查询。它提供了一个表格,用户填写有 关信息后,将请求传入服务器端的 GIS、制图、数据库查询等软件运行相应的搜索和查询, 也可以是空间分析等,其结果可以是地图或者表格,并传回浏览器。微软的门户站点 MSN 也提供了类似的功能 http://msn.maps.expedia.com/quickmaps.asp。 ( 6) GIS 论坛 http://gis.itc.nrcs.usda.gov/gishome.html 该网站包括 GIS 数据以及软件的发布, GIS 领域内的事件,一些技术问题的探讨, GIS 书籍的介绍等等,此外可以通过 Email 的方式进行相关问题的讨论。 4)空间数据发布和下载,数据是 GIS 系统中最为重要的部分,数据的录入和预处理也 是 GIS 应用开发过程中耗费时间、资金最多的一个环节,而通过因特网实现数据共享,可 以降低 GIS 工程的开发成本。由于因特网的迅速发展,促进了电子商务的兴起,空间数据 当然也可以作为一种特殊的商品在因特网上发售。与后面提及的 WebGIS 方式相比,这里的 数据下载还主要是利用文件传输的方式实现。由于因特网上信息量浩大,常常使得找到真正 需要的数据成为一件困难的事情,而应用空间元数据可以使用户迅速定位需要的数据并进行 下载。 1994 年美国政府开始发展国家空间数据基础设施(NSDI ),通过确定元数据标准, 要求各级政府机构采用元数据的方式在网络上对其所生产的数据进行描述,达到各机构间数 据生产和共享的目的。 5)此外,由于因特网的发展,打破了传统的时间——空间联系方式,形成了空间事物 的新的组织形式,称为计算机网络信息空间(Cyber Space) ,是目前人文地理学研究中的热点, 也将是 GIS 探讨的重要课题。 3. 2WebGIS 简介 Web 技术和 GIS 技术相结合,最为激动人心的产物就是 WebGIS(万维网地理信息系统) 。 WebGIS,简言之, 就是利用 Web 技术来扩展和完善地理信息系统的一项新技术。 由于 HTTP 协议采用基于 C/S 的请求 /应答机制,具有较强的用户交互能力,可以传输并在浏览器上显 示多媒体数据,而 GIS 中的信息主要是需要以图形、图像方式表现的空间数据,用户通过 交互操作,对空间数据进行查询分析。这些特点,就使得人们完全可以利用 Web 来寻找他 们所需要的空间数据,并且进行各种操作。具体地讲, WebGIS 的应用可以分为以下几个层 面: 1)空间数据发布 由于能够以图形方式显示空间数据,较之于单纯的 FTP 方式, WebGIS 使用户更容易找 到需要的数据; 2)空间查询检索 利用浏览器提供的交互能力,进行图形及属性数据库的查询检索; 3)空间模型服务 在服务器端提供各种空间模型的实现方法,接收用户通过浏览器输入的模型参数后,将 计算结果返回。换言之,利用 Web 不仅可以发布空间数据,也可以发布空间模型服务,形 成浏览器/ 服务器结构(Browser/Server,B/S) 。 4) Web 资源的组织 在 Web 上,存在着大量的信息,这些信息多数具有空间分布特征,如分销商数据往往 有其所在位置属性,利用地图对这些信息进行组织和管理,并为用户提供基于空间的检索服 务,无疑也可以通过 WebGIS 实现。 与传统的地理信息系统相比,WebGIS 有其特殊之处,主要表现在: 1)它必须是基于网络的客户机/ 服务器系统,而传统的 GIS 大多数为独立的单机系统; 2)它利用因特网来进行客户端和服务器之间的信息交换,这就意味着信息的传递是全 球性的; 3)它是一个分布式系统,用户和服务器可以分布在不同地点和不同的计算机平台上。 3. 3WebGIS 的实现技术 WebGIS 是网络 GIS 的一个重要组成部分,网络 GIS 的一些概念,如客户机/ 服务器模 式、分布式数据管理等,也可以应用于 WebGIS,但是在 WebGIS 实现时,还要着重考虑两 个问题,即控制网络传输数据量以及必须通过浏览器与用户进行交互。 目前已经有多种不同的技术方法被应用于研制实现 WebGIS,包括 CGI(Common Gateway Interface,通用网关接口) 方法、服务器应用程序接口(Server API) 方法、插件(Plug-ins) 法、 Java Applet 方法以及 ActiveX 方法等等,下面对这些技术进行简单的描述和比较。[ 夏 福祥] 3. 3. 1 CGI 方法 CGI 是一个用于 Web 服务器和客户端浏览器之间的特定标准,它允许网页用户通过网 页的命令来启动一个存在于网页服务器主机的程序(称为 CGI 程序),并且接收到这个程序 的输出结果。 CGI 是最早实现动态网页的技术,它使用户可以通过浏览器进行交互操作,并 得到相应的操作结果。 利用 CGI 可以生成图像,然后传递到客户端浏览器(目前大多数主页的访问者计数器 就是采用 CGI 程序实现的)。这样,从理论上讲,任何一个 GIS 软件都可以通过 CGI 连接 到 Web 上去,远程用户通过浏览器发出请求,服务器将请求传递给后端的 GIS 软件,GIS 软件按照要求产生一幅数字图像,传回远程用户。 实际上,由于设计的原因,大多数 GIS 软件不能直接作为 CGI 程序连接到 Web 上,但 是,有以下的两种技术比较成功。 1)用 CGI 启动后端的批处理制图软件,这种软件的特点是用户可以直接在计算机终端 一行一行地输入指令来制图。其特点是用户的每一个要求都要启动相应的 GIS 软件,如果 软件较大,启动时间就会很长。 2) CGI 启动后端视窗(Windows)GIS 软件, CGI 和后端 GIS 软件的信息交换是通过“进 程间通讯协议( IPC-Inter Process Communication) ”来完成,常用的 IPC 有 RPC(Remote Procedure Call)和 DDE(Dynamic Data Exchange)。 其 优 点在于 , 由 于 GIS 软 件 是 消息驱 动的 , CGI 只要通过发送消息,驱动 GIS 软件执行特定操作即可,不需要每次重新启动。 3. 3. 2 Server API 方法 Server API 类似于 CGI,不同之处 在 于 CGI 程序 是单 独可以 运行 的程 序, 而 Server API 往往依 附于 特定 的 Web 服 务器, 如 Microsoft ISAPI 依附 于 IIS(Internet Information Server), 只能 在 Windows 平台 上运 行,其 可移 植性 较差 。但 是 Server API 启 动 后 会 一 直处于 运行 状 态,其速度较 CGI 快。 3. 3. 3 插件方法 利用 CGI 或者 Server API, 虽 然 增 强 了 客 户 端 的 交 互性, 但是 用户 得到 的信 息依然 是静 态的。 用户 不能 操作 单个 地 理实体 以及 快速 缩放 地图 , 因为在 客户 端, 整个 地图 是 一个实 体, 任何 GIS 操作, 如放 大、 缩小、 漫游 等操 作都 需要 服务器 完成 并将 结果 返回 。当网 络流 量 较高时 , 系 统 反应变 慢 。 解决该 问题 的一 个办 法是 利用插 件技 术 , 浏览 器插 件是指 能够 同浏 览器交 换信 息的 软件 , 第三 方软件 开发 商可 以开 发插 件以使 浏览 器支 持其 特定 格式的 数据 文 件。利 用浏 览器 插件 ,可 以将一 部分 服务 器的 功能 转移到 客户 端, 此外 对 于 WebGIS 而言, 插件处 理和 传输 的是 矢量 格式空 间数 据 , 其数 据量 较小 , 这样 就加 快了 用户 操作 的反应 速度 , 减少了 网络 流量 和服 务器 负载。 插件 的不 足之 处在 于 , 象传 统应 用软 件一 样, 它 需要先 安装 , 然后才能使用,给使用造成了不方便。 下 面 是利用 WebGIS 插 件 在因特 网上 显示 空间 数据 的例子 , 利用 插件 能够 方便 地对地 图 进行漫游、缩放和查询操作。 图 13-15: WebGIS 插件,来自于北京大学数字地球工作室 (HTTP://WWW.CYBERGIS.ORG.CN) 3. 3. 4Java Applet( Java 小应用)方法 WebGIS 插件可 以和 浏览 器 一起有 效地 处理 空间 数据 , 但 是其 明显 的不 足之 处 在于计 算 集中于 客户 端, 称为 “胖 客户端 ” ,而 对 于 CGI 方法 以及 Server API 方法 , 数据处 理在 服务 器端进 行, 形 成 “瘦 客户 端” 。利 用 Java 语言 可以 弥补许 多传 统方 法的 不足 , Java 语言 是一 种面向 对象 的语 言, 它的 最大的 优点 ,就 是 SUN 公 司提出 的一 个口 号“ 写一 次,任 何地 方 都可以 运行 (Write once, run anywhere.)” , 即指其 跨平 台特性 , 此 外 Java 语 言 本 身支持 例外 处 理、网络、多线程等特性,其可靠性和安全性使其成为因特网上重要的编程语言。 Java 语言 经过 编译 后, 生 成与平 台无 关的 字节 代码 (Bytecode),可以被 不同 平 台 的 Java 虚拟机 (JVM-Java Virtual Machine)解释 执行 。 Java 程序 有 两种, 一种 可以 独立运 行, 另一 种 称为 Java Applet, 只能 嵌入 HTML 文件中 , 被 浏 览 器解释 执行 。 用 Java Applet 实现 WebGIS, 优于插 件方 法的 方面 是 : 1) 运 行时 , Applet 从服 务器 下 载 , 不 需要 进行 软件安 装; 2)由 于 Java 语言 本身 支持 网络 功能 , 可 以 实 现 Applet 与服 务器程 序的 直接 连接 ,从 而使数 据处 理 操作既 可以 在服 务器 上实 现, 又可 以在 客户 端实 现 , 以 实 现 两 端 负 载 的 平 衡 。 图 13-16 是利 用 Java Applet 实现的 WebGIS 系统结构。 Java Applet 浏览器 WebGIS 服务器 Web 服务器 空间数 据 服务器 空间 数据库 图 13-16:利用 Java Applet 实现的 WebGIS 系统框架 3. 3. 5ActiveX 方法 另一项 可以 实 现 WebGIS 的技术 是 ActiveX, 它是 在 微软公 司 OLE 技术 基础 上 发展起 来 的因特 网新 技术 ,其 基础 是 DCOM(Distributed Component Object Model),它 不是计 算机 语 言, 而是 一个 技术 标准 。 基 于这种 标准 开发 出来 的构 件称 为 ActiveX 控件 , 可以 象 Java Applet 一 样 嵌入到 HTML 文件 中 ,在因 特网 上运 行。 与 Java Applet 相比 ,其 缺点 是只 能 运 行 于 MS-Windows 平台上 , 并且 由于可 以进 行磁 盘操 作 , 其安全 性较 差 , 但 是 优 点 是执行 速度 快, 此外由 于 ActiveX 控 件 可 以用多 种语 言实 现, 这 样 就可以 复用 原 有 GIS 软 件 的源代 码, 提 高 了软件开发效率。 上面描 述了 几 种 WebGIS 的 实 现 方 案 , 在 实际 的系统 建 设中, 可以 根据 待发布 数 据 的 数 据量、数据 类型、 Web 服务器软件、 客户端的要求等确定采用 不同的方案,选择相应的 软 件。 表 13-7:国外几个重要的 WebGIS技术特征 [宋关福等 ] MapInfo ProServer GeoMedia Web Map Internet Map Server(IMS) MapGuide ModelServer/ Discovery 公司 MapInfo Corp. Intergraph Corp. ESRI Inc. Autodesk Inc. Bently 服务器操作系 统 Windows NT/95 Windows NT Windows NT Windows NT Windows NT Web 服务器 支持 CGI 的 Web Server Internet Information Server Internet Information Server 或 Netscape Server 支持 CGI 的 Web Server Netscape Server 其他服务器端 软件 ODBC 、 MapInfo 4.x 、 MapBasic ODBC ArcView 或 MapObjects 应 用、 ODBC ODBC MicroStation GeoGraphics ODBC 客户端操作系 统 Windows 系 列、 Macintosh 、 UNIX Windows NT/95 Windows 系 列、 Macintosh 、 UNIX Windows NT/95 Windows 系列、 Macintosh、UNIX 客户端浏览器 支持 HTML的 任意浏览器 Internet Explorer, Netscape Navigator 支持 HTML的 任意浏览器 Internet Explorer ,Nets cape Navigator Internet Explorer, Netscape Navigator 客户端是否需 要插件 (plug-in)/控件 (control) 不需要 如果使用 Netscape Navigator浏览 器,需要安装 ActiveCGM 插 件;如果使用 Internet Explorer 浏览 器,会自动下 载 ActiveCGM 控件 自动下载 Java Applet 或者 ActiveX 控件 需要安装 MapGuide 插 件(1 兆左右) 需要安装 VRML、 CGM、 SVF 等插件 网络传递的图 形格式 JPEG(栅格图) ActiveCGM( 栅格图和矢量 图) JPEG/GIF( 栅 格图) MWF(矢量图) JPEG,PNG, VRML,CGM,SVF( 栅格图和矢量图) 地图预出版处 理 动态生成地图 动态生成地图 动态生成地图 需地图预出版 处理 动态生成地图 可发布的数据 格式 MapInfo 地图 文件 MGE 工程、 MicroStation DGN 文 件,FRAME 文 件 ,MGEDM 文件,ArcView Shape 文 件 ,Arc/Info Coverage,SDO 文件 ArcView Shape 文 件 ,Arc/Info Coverage,SDE 地图文件, Autodesk DWG 文件 Autodesk DWG GeoGraphics 工程 文件,MicroStation 设计文件 目前, WWW 领域,可扩展标记语言(Extensible Markup Language , XML)得到了越 来越多的重视,它可以成为一种“元语言”,用于定义特定领域的标记语言,同样在空间信 息的 Internet 发布中,也可以采用 XML 来定义地理信息的特定语言标记,以容易而一致的 方式格式化和传送数据。 第十四章 地理信息系统应用实例 导读:本章介绍了地理信息系统在一些具体领域的应用。 由于GIS是用来管理、分析空间数据的信息系统,所以几乎所有的使用空间数据和 空间信息的部门都可以应用GIS。由于各个部门的不同,GIS在具体业务系统中所 占的比重、应用方式也各异,结合比较紧密的如城市规划、环境领域等,相对松散 的有商业、医疗卫生领域。 本章简单介绍了一些GIS应用实例,针对不同实例,介绍方法也不同,有的概述一 个具体区域的应用,有的叙述工作流程,有的介绍了工作原理和分析方法,可以对 相关领域的GIS建设提供借鉴,也可以作为其它领域建设GIS的参考。 本章也引入了一些新的概念,如AM/FM、GIS/T以及一些具体的分析方法,如动态 分段模型,它们处于GIS与具体领域的交叉部分,同时也是GIS理论和技术的有益 补充。 1.城市规划、建设管理 城市是人类活动高度集中的区域,同时也是信息、物质高度集中的区域。随着科技的进 步和经济的发展,城市系统越来越复杂,数据和信息越来越多,服务要求越来越高。城市管 理面临着新的挑战,为了城市的现代化、生态平衡和持续发展,城市需要全面的规划,而地 理信息系统给城市的规划和管理带来了新的工具。 在城市管理中,可以应用GIS 的方面非常多,如土地、道路、管网、环境、人口等等诸 多要素都可以通过地理信息系统进行管理 * ,并且形成了应用于专门领域的 GIS工具,如土地 信息系统(LIS-Land Information System )和AM/FM (自动制图/ 设施管理,Automatic Mapping/Facility Management) ,前者侧重于管理地块的位置、面积、权属以及地籍的动态变 化;后者则主要对电力、通讯等设施的管理和分析、制图。 城市建设规划涉及的因素非常多,开发新城要征用土地,改建旧城要拆迁安置,同时需 要基础设施、 公共服务设施的配套。在开发建设活动中, 如果不注意各工程项目之间的协调, 就可能造成混乱,而采用 GIS 对各种信息进行管理,并基于此进行分析和辅助决策,可以 有效地防止这种混乱局面的出现。由于城市在不断地建设发展,所以需要随时更新城市基础 数据库,这就要求应用 GIS 管理日常城市建设活动,以保证信息的时效性。下面介绍 GIS 在密尔沃基(Milwaukee )市城市建设日常管理方面的应用。 美国威斯康星州的密尔沃基从 1976 年开始建设城市地理信息系统,并不断发展、完善。 由于数据库比较完整,地理信息系统在很多方面发挥了作用,主要可以分为三个方面的活动。 1)地图更新 密尔沃基市常用地图分为三种: 第一种是地籍房产图(当地称为 Plot Map),由政府税务部门负责编制。这种地图通常 在以下情况下需要修改更新: g108g32地契内容改变,包括地块边界的变化以及地块权属的变化; g108g32在一个大的地块内再划分为若干小块,产生新的土地所有者; g108g32公共道路的拓宽或者连通; * 下面提及的GIS 在环境、道路等方面的应用也可以认为是地理信息系统在城市管理中应用的部分。 g108g32小地块合并成为大地块; g108g32其它变化,如道路名称、地名的改变以及错误的纠正。 第二种是一般的测绘图(当地称为 Quarter-Section Map) 。这种图由政府市政工程部门 负责编制,图面上标有主要的地块边界(不作为法律依据),但是没有普通的建筑物,通常 在下列情况下需要更新: g108g32城市建设造成地面重要物体的边界变化; g108g32重新测量,纠正过时的内容; g108g32道路打通、拓宽或封死; g108g32大的地块合并或重新划分; g108g32街道名称改变; g108g32地图上的错误纠正。 第三种是土地使用图(当地称为 Land Use Map)。这种地图反映土地的实际用途,也反 映了主要的地块边界。土地使用图由城市规划部门负责编制,主要为城市规划服务,通常在 以下条件下需要更新: g108g32房屋的拆除和重建; g108g32房屋改变用途; g108g32地块边界改变; g108g32地块重新划分; g108g32地块兼并; g108g32道路变化; g108g32道路名称的修改; g108g32地图错误纠正。 以上三种地图由三个相互独立的部门各自负责,在信息上存在很多重复内容,在地图更 新时也需要大量的重复工作。在建立城市地理信息系统之后,三种地图上各类信息的更新工 作明确地分配到三个部门,三种数字化地图集中地存放于数据库中,实现数据共享,每个部 门对数据的修改内容可以被其它部门得到,减少了数据冗余和重复工作。 2)土地区划管理 在美国,大多数地方政府都用土地区划(Zoning)来指导、限制城市土地利用和城市发 展,但是具体做法各地有许多差异,在密尔沃基市,先由城市规划部门编制土地使用规划, 经批准后再制定区划,区划的形式为文本和图件,它是城市建设和审批修建申请的依据。 密尔沃基市的土地区划图分为用途图、范围图和高度图,用途图用于限制和规定相冲突 的土地利用,如不准贴近主要交通干道修建大型商业设施等;范围图对建筑之间的距离以及 建筑后退道路等作出了规定;高度图则规定了建筑本身的高度、相邻建筑在高度上的相互关 系的限制。 在采用 GIS 后,这三种区划图分为三个图层进行管理,并可以叠加在一起显示,避免 各个部门数据不一致的情况,此外,可以很方便地检查规划图的错误,避免法律上的纠纷; 也便于税收部门查询地产信息,调整对土地所有者的税收。 3)建筑审批处的内部工作管理 每个建筑物在修建之前,必须经过政府主管部门批准,由于申请非常多,并且需要实地 勘察,工作繁重,如何分配并确定每个经办人员的工作,以充分调动每个人的积极性成为一 个难题。在建立地理信息系统后,修建项目申请卡片被记录到属性数据库中,其中的建筑物 地址属性与地块空间数据相关联,这样可以很方便地将一定时期内所有的修建申请的位置分 布显示在地图上(图 14-1) ,可以方便的根据申请量的多少、到市中心的距离、前往勘察的 边界程度,划分每个工作人员的负责范围,提高了工作效率,改善了建筑审批处的内部管理。 图 14-1:利用 GIS 进行建筑审批工作协调 2.农业气候区划 2. 1 项目背景与需求 自八十年代以来,中国农业生产环境、气候环境发生了巨大变化,包括: 1)农业 科学技 术进步 ,高 新技术引 进, 农业朝 高产 、优质、 高效 、低耗 方向 发展; 种 植业向 粮食 —经 济— 饲料 作物三 元结 构转 变; 小生 产、 大市 场向 规模经 营方 向发展 , 逐 步 实 现种养加、产供销、贸工农一体化。农村产业结构调整向农业气候区划提出了新的要求。 2)气候 条件与 气候资 源本 身发生了 变化 。如东 北地 区平均气 温升 高,北 方地 区干旱 范 围扩大 , 长 江流 域洪 涝增 多, 特 别 是 九 十 年 代 以 来 , 异常 气候 事件 呈现 明显 增多的 趋势 。 有 必要重新认识气候资源的变化及其合理利用和保护问题。 3)农业 气候区 划技术 条件发 生了巨 大变化 。 “ 3S” ( GIS、 RS、 GPS)与网 络技 术在农 业气候资源动态监测与开发应用中展示出广阔前景。 4)农业 生产的 发展, 对气 候资源开 发利 用和保 护提 出了更高 要求 。气象 部门 必需依 靠 科技进 步 , 技 术 创 新适应 社会的 需求 。 建 立 一套基 于“ 3S” 、网 络平 台的 区划信 息 系统, 有 助于广大气象台站在气象服务手段和技术上得到提升。 5)面 对 21 世纪 农业 新技 术革命 和可 持续 农业 战略 , 农 业 气 候 资 源 作 为 一 种 重要的 投资 环境,有必要进行科学、客观的评价。 中国气 象局 提出 建设 “第 三次农 业气 候区 划” 项目 的目的 是: 采用 新技 术、 新方法 、 新 资料, 开发 “农 业气 候区 划信息 系统 ( Agriculture & Climate Distributed Information System, 简称 ACDIS) ” 软 件, 建立 气候资 源开 发利 用和 保护 监测体 系 , 实 行 资 源 平 面 与立体 , 时 间 与空间 全方 位优 化配 置; 发挥区 域气 候优 势, 趋利 避害减 轻气 候灾 害损 失, 提高资 源开 发 的 总体效益。为各级政府分类指导农业生产,农村产业结构调整,退耕还林防止水土流失等提 供决策依据,为地方政府服务。 2. 2 农业气候区划信息系统(ACDIS )系统结构及工作流程 2. 2. 1 系统结构 农业气候区划信息系统 (ACDIS ) 是基于 GIS 工具平台,建立起面对专业技术人员的专 用工具,适用于农业气候资源监测评价、气候资源管理与分析,小网格气候资源推算与空间 查询、省地县三级区划产品制作等。具体实现了以下功能: 1)地理基础信息管理:管理工作区的基础地理数据,如行政区划,水系,交通数据等; 2) 小网格资源信息管理: 管理栅格格式的、与农业气候区划有关的信息, 包括各种 DEM 数据; 3)小网格资源推算与区划产品制作; 4)农业气候资源监测与评价; 5)农业气候区划成果演示。 2. 2. 2 系统工作流程 根据“3S ”等新技术在区划中应用需求,建立了农业气候区划工作基本流程 (如图 14-2): 区 划 指 标 分 析 与 确 定 确 定 资 源 小 网 格 推 算 模 式 建 立 区 划 小 网 格 资 源 库 调研 考察 专家 座谈 政府 发展 规划 农业 结构 调整 应用 3S 进行土地 分类 模式运算生成 资源数据层集 需 求 分 析 确 定 区 划 对 象 收集观测试验数据 收集考察研究成果 多元分析综合评判 农业气候相似分析 专家评判分级 观测资料及研究成果 辅助考察、气候分区 统计分析、模型建立 误差订正效果检验 应用 GIS 建立地理 参数数据集 区 划 图 件 产 品 制 作 区划产品输出 数据叠加分析 专家评审 修订区划结果 图件制作与打印 建立土壤、植被、 水体数据集 图 14-2:农业气候区划工作基本流程图 2. 3“ 3S”在项目中的应用 1)利用 GIS 对农业气候区划综合要素空间查询和管理 ACDIS 利用 GIS 工具 提供 的基本 功能 ,对 其它 子系 统输入 、处 理和 生成 的气 候资源 等 数据进 行综 合查 询和 管理 。 生 成不 同查 询条件 下的 区划产 品 , 作 为区划 专题 内容 , 进 而实 现 对 区划各类 产品的 矢量图、 栅格图、 DEM、注 记和属 性数据进 行以地 理表达式 为条件的 逻 辑查询 以及 不同 图件 和属 性数据 的综 合查 询、 管理, 并把查 询结 果制 图输 出到 绘图仪 或打 印 机,或保存为其它格式文件。 2)利用 GIS 对气候资源进行小网格推算模式研究 气候资 源小 网格 推算 模式 研究是 区划 的一 项基 础性 工作 。 在收 集山 区气 候研 究成 果 基 础 上, 辅助 以气 象哨 、 水 文 站雨量 资料 后 , 通 过 GIS 平台可 快速 计算 和获 取测 点地理 参数 ( 高 程、坡 向、坡 度) 。 采用统 计分析 方法, 根据要 素的 统计特 征值和 地理特 征将 全省划 分若干 气候区 , 分 别 建立各 区域 气候要 素推 算统 计模 式, 通过验 证和 残差 订正 , 应 用到气 候资 源 小 网格推算中。 3) GIS 在农业气候资源分析中的应用 应用 GIS 来 定 量 采 集 、 管 理、分 析具 有空 间特 性的 气候资 源, 建 立 GIS 分析 气候资 源 的思想 、 方 法 、 步骤 , 包 括数字 高程 模型 建立 、 GIS 农业 气候 资源 数据 建立 、 空 间分 析模 型 建立、气候资源分析计算、气候分区及定量分析等。 4)利用“3S”提取农业背景信息参与区划计算 农业气候区划是 根据农作 物生长发育过程 中对气候 条件的要求和气 候资源的 地理分布 特征来 进行 分区 划片 的, 在某种 农作 物的 气候 可种 植区内 还有 不同 的地 物类 型, 不 同 的 农 作 物要求 不同 的地 理环 境。 为使农 业气 候区 划对 农业 生产更 具有 指导 作用 , 将 非气象 因子 引入 到农业 气候 区划 中。 农业 气候区 划对 象中 往往 对土 壤 PH 值要 求很 高, 根据 土壤 类 型 分 布 可 以 得 出土壤 PH 值 的 分 布 ,将其 作为 区划 的一 个关 键指标 ,使 得区 划更 加有 实际应 用意 义。 利用 GIS 将土壤 分类 图作 为一项 数据 层参 与气 候资 源数据 层集 运算 ,得 出包 含土壤 类型 信 息的区划结果。 江西省 在全 省优 质早 稻种 植气候 区划 和万 安县 脐橙 种植综 合区 划中 ( 图 14-3) ,除 了 应 用 1∶ 25 万的 地理 数据 ,还 结 合 了 TM 影像 数据 ,辅 助 GPS 定位 抽样 ,把 早 稻、脐 橙的 可 能种植 区 ( 农田、 荒山 荒 坡 ) 提 取出 来, 排 除 了 山 体 、 水 体、 居 民点、 道路 等不能 种植 脐橙 和早稻 的区 域, 把可 能种 植区与 农业 气候 区划 图做 逻辑交 集运 算, 得到 了全 省优质 早稻 和万 安县脐橙种植规划图。 图 14-3:江西省万安县脐橙种植区划 5)利用 GIS 建立集区划—资源动态监测—高产栽培技术为一体的信息服务系统 利用 GIS 工具,开 发出 基 于 Web 的 、 对 气 候 条 件 敏 感的两 系杂 交稻 制种 气候 资源空 间 配置信 息系 统 , 将区 划服 务于作 物生 产基 地选 择、 关键生 育期 气象 服务 、 农 业生产 技术 指 导 等各个方面。 3.大气污染监测管理 随着经 济的 发展 , 环 境污 染直接 影响 了人 们的 生活 质量, 环境 质量 问题 也得 到了越 来越 多的重 视。 污染 环境 包括 水污染 、 大 气污 染、 固体 废弃物 污染 等, 其中 就大 气污染 而言 , 城 市区域 由于 受到 工业 生产 、 居 民生 活的 影响 , 成 为 大气污 染发 生的 集中 区域 , 历 史上 几次 严 重的污 染事 故, 如伦 敦烟 雾事件 ( 1952) 、 洛 杉 矶 光 化学烟 雾事 件 ( 1943) , 都 是发生 在大 城 市。 近几 十年 来, 研究 者 对大气 污染 问题 进行 了大 量研究 , 并 且 通过实 验或 计算来 建立 适合 于特定区域的大气污染物扩散模式以及确定相关参数的计算方法。 城市大 气污 染的 来源 主要 包括点 状污 染源 和线 状污 染源, 前者 主要 包括 烟囱, 后者则 指 汽车尾 气排 放。 而污 染的 扩散的 影响 因子 , 除 了排 放量、 排放 物之 外, 还受 到气象 条件 、 下 垫面等 因素 的影 响。 通过 大气动 力学 的研 究, 研究 者给出 了用 来描 述污 染物 在大气 中扩 散规 律的各 种解 析方 程。 这些 大气扩 散公 式为 空气 污染 预报提 供了 一定 的基 础, 可以为 现有 污染 源条件 在不 利的 气象 条件 下减少 有害 污染 物的 排放 、 在城市 规划 中合 理进 行区 域规划 以及 环 境影响评价提供了切实有效的信息。 无论是 点源 污染, 还是 线源 污染, 其 空 间 分 布 以 及 属 性 可以通 过地 理信 息系 统进 行管理 , 而污染 扩散 的影 响因 子的 空间分 布同 样可 以作 为 GIS 的空 间数 据组 成部 分 , 所 以 , 基 于 GIS 可以建 立大 气污 染扩 散模 型,进 而, GIS 也 提 供 了 丰富的 功能 以表 现污 染物 强度空 间分 布, 可以查询强度分布状况,并可以结合其它社会经济数据,进行更加细致的评价分析。 下面介绍内蒙古自治区包头市在利用 GIS 进行大气污染扩散模拟中的应用。 包头市 是中 国最 大的 稀土 工业基 地和 著名 的钢 铁机 械工业 基地 之一 , 是 门类 齐全, 体系 较为完善的现代化工业城市。包头市工业能源消耗以燃煤为主, 占 56%,其次为焦碳和 电 力, 在 能 源 结 构 中 , 重 中污 染能源 占 70.8%, 包 头工 业排 放的 SO2、 烟 粉尘 和氟 化物都 较大 , 造成包 头市 煤烟 型和 氟污 染的特 点。 其中 21家重 点 空气污 染源 占全 市工 业排 放的 95%, 85%, 96%(分 别为 SO2、 烟 粉 尘和氟 化物 ) 。 其 中 包 钢 是 最大污 染厂 家, 其 SO2、 粉尘、 氟化 物 的排放量高居榜首。 从自然 条件 上看 , 包 头 市 地处内 陆 , 属 内 陆 半 干 旱 、 中温带 大陆 性季 风气 候 , 全年干 燥, 无霜期 短。 年均 气温 6.5℃ ,取暖 期 6 个月 。由 于受 地形影 响, 冬季 包头 多北 风和西 北风 , 夏季多 东南 风, 各月 夜间 均盛行 NWW 风 。 近 年 来 城市建 筑的 快速 发展 及自 然植被 ,人 工 绿化面 积的 不断 扩大 , 市 区平均 风速 呈逐 年下 降趋 势。 1995 年年 均风 速为 2.2m/s。 一年中, 春季风 速最 大 , 秋季 风速 最小 , 冬 季风 速居中 。 除 七月份 主导 风向 与最 大风 速风向 恰好 相反 外,常年盛行风向与最大风速风向重合。 逆温层 影响 着污 染物 的扩 散、 稀释 , 包 头 市 冬 季 逆 温频率 很高 , 夏 季 逆 温 频 率较低 , 逆 温的强度与厚度,冬季均明显大于夏季。 包头是 我国 大气 污染 治理 的重点 城市 , 包 头关 于大 气污染 扩散 的研 究工 作较 多。 冶 金 部 建筑研 究总 院 1982 针 对 包 钢地区 的烟 气综 合治 理规 划,利 用风 洞模 拟试 验、 现场实 验等 提 出 了 “大 气输 送气 候学 模式 ” ( ATCM) 。 1989 年 包 头市环 境监 测站 , 针 对包 头新市 区大 气扩 散模式 和 SO2 容量 计算 ,提 出 了 基 于美国 EPA 的 ISC(工 业复 合源 大气 扩散模 式 ) 的 城 市 多源高斯模式。这些模式的建立为包头市的大气污染治理和管理提供了可靠的依据。 基于 GIS 建立大气污染扩散模型,可以 1)模拟污染物的空间分布,评价不同区域的环境质量; 2)将污染物空间分布与人口密度空间进行复合分析,确定受污染影响的人口数目; 3)预测在给定气象条件下污染物的空间分布; 4)确定不同点源对整个研究区污染总量的贡献;进而 5)为污染整治,如降低排放量、甚至关闭某些污染源,提供决策依据; 6) 如 果要 增加 污染 点源 , 可以比 较不 同的 方案 ( 如 烟囱的 位置 , 高 度 等 ) , 从 中选择 最 优方案; 7)在城市规划时,作为确定不同用地(居住、工业、商业等)的分布。 在包头 市的 研究 工作 中 , 利用 1 月份 平均 风速 、 风 向、 频率 , 并 将其 换算 为 风频表 , 对 包头市的 37 个高架点源造成的地面 SO2 浓度的空间变化进行模拟,结果如图 14-4 所示。 图 14-4:包头市大气二氧化硫分布图 将模型 预测 结果 图与 包头 市环境 监测 站绘 制的 等值 线图相 比较 。 模型 在工 业区 的预测 值 比较切 合实 际 , 在昆 都仑 区, 预测 值偏 小, 原因 应 该是由 于包 头地 区在 一月 份特定 风向 条件 下, 工业 污染 对该 区域 的影 响比较 小 , 相 比 之 下 居 民 取 暖燃煤 造成 的二 氧化 硫污 染就较 突出 。 总体来 看, 无论 从工 业区 还是居 民区 ,模 型预 测的 二氧化 硫的 浓度 不存 在数 量级上 的差 别 。 在大气 环境 规划 中 , 对 规 划中欲 添加 的新 污染 源需 要预测 新增 污染 源造 成的 污染 、 对 新 源的进 行合 理选 址、 确定 新源的 排污 量大 小以 及点 源烟囱 的高 度等 。 在 研究 中, 拟在 青年 农 场(图上三角 点位置)增 加一个新的污 染源,有三 种方案,分别 为源强为 100000mg/s、烟 囱高 150 米 ;源强 1000000mg/s、烟囱高 150 米 ;源强 1000000mg/s、烟囱 高 200 米。 在一 月风向风频条件下进行预测,将预测结果叠加在原来的污染分布状况上,结果如图 14-5。 图 14-5:增加不同参数污染源的污染分布图 大气污 染的 受害 人群 是大 气污染 管理 和控 制中 最重 要的关 注对 象, 结合 包头 市新市 区 (青山区 和昆都 仑区 )的 人口分布 ,研究 中分 析了 添加新源 前后大 气中 SO2 污染受害 人群 的变化 。 研 究方 法是 将模 型的预 测结 果与 包含 人口 数据的 行政 区划 图进 行叠 加复合 分析 , 获 得各个污染区的面积和人口,结果见表 14-1。 表 14-1:新添加污染源造成的污染人群变化结果表(单位:万人) 浓度单位: mg/m 3 0.00-0.05 0.05-0.15 0.15-0.25 0.25-1.6 新源强: 100000mg/s 新源高: 150 米 46.05 15.33 2.10 0.80 新源强 : 1000000mg/s 新源强: 150 米 36.20 24.30 2.73 1.04 新源强 : 1000000mg/s 新源强: 200 米 41.02 20.02 2.33 0.89 未添加前大气状况 49.83 15.61 2.03 0.80 从图和表可 以看出, 源强 为 1000000mg/s 的污染源 造成的高浓 度受害人 群数 量明显增 加,而 源强 为 100000mg/s 的新添 污染 源造 成的 高浓 度污染 受害 人群 数量 变化 不大。 同时 可 以看出 , 增 高污 染源 的高 度来降 低污 染的 危害 是以 低浓度 受害 人群 数量 的增 加为代 价的 。 从 新增污染点源 的污染分析 来看可以考虑 在青年农场 位置新建立一 个源强为 100000mg/s、烟 囱高为 150 米的新点源。 4.道路交通管理 近年来, GIS 在交通方面的应用得到了广泛的重视,并形成了专门的交通地理信息系统 GIS-T,以满足道路交通管理方面的要求。下面分几个方面介绍 GIS 在公路方面的具体应用。 4. 1 路廓设计 路廓设计是公路设计中的一个重要环节,是定出公路最终线向的一个步骤。在路廓设计 中,要综合分析多种空间数据,包括大比例尺的土地利用图、地形图以及现有的道路网等。 从各方面收集来的资料合并到 GIS 资料库中,建造约束多边形,确定公路需要避开的 区域,通常这些多边形可以分为三级: 1)第一级约束是必须要避开或减至最少; 2)第二级约束是尽量避开或减至最少; 3)第三级约束是可以避开或减至最少。 根据需要可以用权重表示不同的约束等级,并在地图上分别显示,以便设计员在设计路 线时尽量绕开这些区域。然后将每条试验性线路输入到 GIS 中,利用缓冲区分析得到路廓 多边形,与约束多边形进行叠加分析,计算路廓与每个多边形相交的总面积,并乘以权重, 得到该试验线路的约束影响的加权总面积(Total Impact Weighted Area, TIWA ) ,用于比较这 些线路设计。 在计算得到 TIWA 之后, 可以根据 DEM 进行线向的详细设计, 其主要操作是根据 DEM 得到道路横断面,进而进行填挖方的优化,得到最终的路廓设计结果。 4. 2 道路管理 4. 2. 1 道路管理涉及的属性 在公路管理中,通常需要根据其类别、车道数目和路面种类进行分类,其管理的属性包 括: 1)公路属性:路网标识,道路标识,路段标识,参考点等; 2)几何属性:路面宽度,路向,车道数目,坡度等; 3)设施属性:中央隔离带和隔离物,护轨,桥梁,交通标志,路灯,交通量计算仪; 4)公用设施:收费所,交叉口,涵洞,交通管理站等; 5)建筑材料属性:面层,覆盖层,基层,路基; 6)道路使用统计属性:交通量,每天平均流量,事故,车重统计,车类统计,进路要 求; 7)验收记录属性:强度,粗糙度,障碍物,路面损坏程度,限速区段,车速调查; 8)合同属性:预算,费用,图则,日期等; 9)维修工程属性:工程类别,预算,费用,数量,日期。 这些属性是通过线性定位方法与路网建立关联,通常线性定位的方法有里程碑法和控制 段 法, 前 者 采 用 路 名 和 公 路 上的里 程点 来确 定物 体的 位置; 后者 则将 公路 分成 相连的 、 长 度不等的控制段,每段有一个编码,并且其属性一致(表 2) 。 表 14-2:采用控制段方法记录属性 控制段 表层 车道数目 状态 起点 终点 CS1 砾石 2 坏 CS2 沥青 4 良好 30.08 30.16 CS3 沥青 2 尚好 30.16 30.2 CS4 沥青 2 良好 4. 2. 2 动态分段 交通模 型的 一个 特点 是, 多种线 性物 体, 重叠 在同 一个路 网上 , 如 限速 区段 , 公 共 交 通 线路都与路网 重叠,这 使得 GIS 在应用于交通 时遇到困难, 而动态分 段( Dynamic Segmentation)方法较好地解决了该问题。 动态分 段是 在数 据库 中纪 录道路 的每 种属 性的 起止 点到道 路原 点的 距离 , 并不 是真的 将 道路切断存储,适合于动态的分析,顾名动态分段。 采用动 态分 段之 后, 一个 路段( Segment) ,是 路网 上两个 交点 间连 线或 者弧 的一部 分 , 路段的 长度 用其 占连 线的 比例来 表示 ,具 有唯 一的 标识码 。在 GIS 数据 库中 ,路段 是依 附 于路网 数据 , 本 身没 有坐 标。 由 于 采 用 动 态 分 段 将 道路的 各种 属性 以及 其分 布集中 在一 个图 层中进 行管 理, 采 用 线 性 定位方 法, 因 而 容 易 实 现 各 种 “ 点线” 以及 “ 线 线 ” 的叠加 查询 分 析,形如: 交通流量 >800,000 AND 路面状况 =“良好” AND 道路分级 =“省道” 4. 3 流量和路径分析 4. 3. 1 道路网络拓扑 一个路 网的 表现方 式可 以 偏重其 “几 何性” 或者 “ 拓扑性” ,在 道路 设计中 , 需要用 到 其几何表现,而网络分析则着重于拓扑关系(图 14-6) 。 图 14-6:路网的两种表现方式 在交通 网络 中, 大多 数线 与线之 间的 交点 是具 有拓 扑性的 交点 , 即 在道 路的 交点处 车辆 可 以 转向; 但是, 由于 在 GIS 中, 使用 的是 平面 图 形 ( Planar Graph) , 而 有 些 道路的 关系 需 要在三 维空 间中 才能 够正 确表现 , 如 立 交 桥 , 实 际 上道路 并不 直接 相交 , 但 是在平 面图 形上 却表现 为一 个交 点, 这需 要在应 用时 进行 判定 , 区 分拓扑 交点 和非 拓扑 交点 , 以 防止 出现 错 误的网络分析结果。 4. 3. 2 用于道路网络分析的数据结构 进行道 路网 络分 析时 , 可 以只关 注其 拓扑 数据 表现 , 其 数 据 结 构 和 相 关 算 法 可以采 用已 经成熟 的“图 ”数据 结构 ,一种 最为简 单的实 现方 式就是 “连通 矩阵” ,记录 了结点 与结点 之间的连接关系(图 14-7) 。 - 1 1 0 0 1 - 1 1 0 1 1 - 1 1 0 1 1 - 1 0 0 1 1 - 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 图 14-7:网络连通矩阵 在连通 矩阵 中, 单元 格数 值为 1 表示 两个 结点 直接 相连, 反之 表示 不直 接相 连, 这 样 的 连通矩 阵可 以用 于进 行连 通性、 可达 性分 析; 矩 阵 中 每个单 元格 的数 值还 可以 是结点 之间 的 距离 , 不 直接 相连的 结点 间距离 可以 用无 穷大 表示 , 利 用该 矩阵 可以进 行最 短路径 搜寻 。 在 不考虑 连线 的方 向性 , 即 图是无 向的 , 连 通矩 阵是 对称阵 , 而 在城 市道 路交 通中, 常常 会出 现“单行线”的情况,即连线是有方向的,这样矩阵是非对称的。 在城市 交通 应用中 ,还 会 出现“ 禁止 左转” 、甚至 “ 禁止右 转” 的情况 ,这 时 ,除了 连 通矩阵 之外 , 还需 要记 录每 个结点 —— 即路 口— —的 连通属 性 , 同样 可以 用连 通矩 阵 实 现 (图 14-8) 。 1 2 3 - 1 1 1 - 0 0 1 - 1 2 3 1 2 3 终止道 路 起 始 道 路 图 14-8:路口的转向和道路连通矩阵,其中第 2, 3 条道路禁止左转 在实际的网络分析中,需要综合利用结点的连通矩阵和结点上道路的连通矩阵。 4. 3. 3 流量和网络分析的具体应用和相关模型 流量和 网络 分析 一般 较多 地应用 于城 市交 通中 , 为城 市交通 管理 和道 路规 划提 供科学 的 决策支持,其中,有如下四类主要的模型: 1) “出行产生( Trip Generation) ”模型 根据交 通分 析区 ( Traffic Analysis Zone,TAZ) 的 土 地 利用形 态以 及其 它社 会经 济数据 来 估计各个区域所产生和吸引的交通量,例如,居住区会产生出行,而商业区则吸引出行。 2) “出行分布( Trip Distribution) ”模型 根据出行产生分析的结果,确定各个区域之间的交通量。 3) “交通工具选择( Mode Choice) ”模型 将交通量计算分配到交通工具上,计算车流量。 4) “出行分派(Trip Assignment ) ”模型 根据交通线路的容量和速度,将车流量分配到各条道路上。 上述的四种模型,包含多种传统 GIS 工具所不支持的统计分析运算以及具体的经济地 理模型,在具体实现时,可以在 GIS 中运算,将结果输出到其它系统中,进行专业模型计 算。 5.地震灾害和损失估计 对地震灾害以及地震次生灾害的评估对于一个区域的降低危险,资源分配以及紧急响应 规划具有重要的意义,而通过存储和分析地质构造信息,利用 GIS 可以预测地震发生的“场 景”并估计该区域由于地震引发的潜在损失。此外, GIS 也提供了有力的工具使得在地震实 际发生时,分析灾害严重程度的空间分布,帮助政府分配紧急响应资源。 进行地震灾害评估时要综合考虑地质构造等各种信息的空间分布, 通常包括以下几个步 骤(图 14-9): 1)估计地表震动灾害 需要识别地震源点,然后建立在该点发生地震以及地震波传播的模型,最后根据地表的 土壤条件得到最终的震动强度。 2)估计次生的地震灾害 次生的地震灾害包括液化(Liquefaction),滑坡,断裂等,评估这些灾害需要收集相应 区域的地质构造信息,计算地表运动的强度和持续时间以及在以前的地震发生过程中这些灾 害发生的情况。 3:估计对于建筑物的损害 需要收集地震区域内建筑和生命线的分布状况,然后对每种建筑的建立损害模型,该模 型是一个函数,与地表震动强度以及潜在的次要灾害有关。 4:估计可以用金钱衡量和不可以用金钱衡量的损失 可以用金钱衡量的损失包括受损建筑的修复和重建,而不可以用金钱衡量的损失包括人 员伤亡。估算这些损失需要相应的社会经济信息,此外,清除垃圾和重新安置费用、失业、 精神影响以及其它的长期或短期的影响,需要建立不同的模型,分别加以确定。 第 一步: 地 表 震 动损失 估计 第 二步: 次 生 灾 害损失 估计 第 三步: 建筑 损失估 计 第 四步: 金钱和 非金 钱的 损失 地表 运动 放大 模型 震源 分空 间布 当地 土壤 条件 次生 地震 损害 模型 建筑 物损 害模 型 建筑 物数 据库 社会 经济信 息数 据库 金钱 损失 非金 钱 损失 地震 波传 播模 型 地震 发生 模型 图 14-9:地震损失评估过程 如 上 图 所 示 , 在 地震 损失评 估 中 , 用 到了 多种 空间信 息, 如地 质构 造, 建筑等 等, 因此 GIS 是非 常理 想的 进行 地 震损失 评估 的工 具, 图 14-10, 13-11 描述 了采 用 GIS 进行 评估 的 过程。 图 14-10:基于 GIS 的地震损失评估过程( 1) 图 14-11:基于 GIS 的地震损失评估过程( 2) 通常, 地表 震动 强度 可以 根据震 源位 置以 及地 震波 传播公 式计 算; 而次 生灾 害以及 建筑 物的损害要根 据相关的图 件进行计算, 并基于上述 计算的结果来 评估金钱损 失和非金钱 损 失。 在分 析过 程中 , 由 于 地震强 度以 及破 坏程 度随 着到震 源的 距离 增大 而衰 减, 所以 要采 用 缓冲区 计算 模型 ; 而 在计 算金钱 损失 以及 非金 钱损 失时 , 因 为要 综合考 虑多 个因素 , 要 使 用 叠加复合模型。 6.地貌 地貌学 理论 发展 和生 产实 践需要 加强 计量 地貌 研究 。 然而, 由于 地貌 现象 的复 杂性、 地 貌数据 的庞 大等 多方 面的 原因, 需要 在地 貌研 究中 采用 GIS 工具, 使其 成为 地貌定 量研 究 的一个有效途径。 在地貌研究中采用 GIS 技术具体实现步骤和内容归纳为: 1)研究地貌信息内涵和地貌系统的特点。 2)根据地貌信息及其分析方法的特点,结合 GIS 工具建立地貌信息专题分析系统。 3) 在 地 貌 信 息 系 统 的 支 持 下 , 建 立综 合的 定量 地貌 分析模 型, 利用 尽可 能多 的信息 源, 分析地 貌信 息流 及其 相关 物质流 、 能 量流 规律 , 研 究地貌 形态 、 物 质组 成、 成因机 制、 分布 特征、发生发展规律及其对人类生产、生活环境的影响作用。 4)开发 机制 地貌 制图系 统 作为地 貌信 息系统 的输 出 系统, 将以 上的分 析结 果 编制成 各 种平面 或立 体的 地貌 分析 图件, 实现 地貌 制图 自动 化, 将 在 资 源 开 发 、 环 境 整治、 生产 建设 的实际目标中发挥更大的作用。 6. 1 地貌信息的内涵、地貌系统的特点与分析方法 地貌是 地壳 表层 内外 营力 共同作 用到 某一 发展 阶段 所形成 的三 维地 表形 态, 是内、 外营 力,介质性质和时间的函数,可表述如下: ),,,,,,( tmFFzyxFM ei = 其中 M表 示 地 貌形态 ; F表 示内外 营力 对地表 的作 用 ; x, y, z为空 间坐标 ; F i 表示内 营力 ; F e 表示外营力; m表示构成地貌的介质性质,包括岩性与构造两个方面; t表示作用时间。 内外营 力的 类型 、 强 度、 作用方 式、 介质 性质 与作 用时间 的不 同组 合, 直接 影响着 地表 形态特 征。 也就 是说, 在地 貌信息 中蕴 含着 归属 于不 同内外 营力 和不 同发 展阶 段的特 征地 貌 信息 , 以 此为 信息源 , 提 取所需 各种 特征 参数 进行 复合分 析 , 可 以得到 不同 专题的 综合 评价 结果。 地貌系 统是 一个 开放 性的 动态系 统, 是由 各种 地貌 形态类 型和 要素 构成 的复 杂综合 体 , 它不仅 在内 部各 子系 统之 间进行 着物 质、 能量 和信 息流的 迁移 和转 化, 而且 在系统 与外 部环 境之间 也进 行着 物质 、 能 量和信 息流 的交 换, 从而 形成一 个复 杂的 物质 、 能 量和信 息的 传 递 网络。 地貌 系统 总处 于输 入—— 转换 —— 输出 的动 态过程 中, 即经 常有 能量 自源区 经系 统流 向耗散 区 , 使 系统出 现导 致有序 化的 熵减 过程 , 从 而具有 一定 的结 构性 和相 应的熵 位 , 存 贮 容量和 自调 节能 力。 地貌 的发展 、发 生和 演化 ,实 质上就 是在 地貌 系统 外部 环境能 量流 内 、 外营力 作用 下, 构成 地貌 要素的 地表 物质 经历 的变 形变位 (抬 升、 断 错等) 分 离组合 (侵 蚀、 搬运、 堆积 等) 的复 杂物 质流传 输过 程。 由于 地貌 物质传 输过 程与 热力 学传 导有相 似性 , 许 多地貌演化模型,如斜坡演化模型都是热传导方程的形式: 2 2 2 2 y H x H t H ? ? + ? ? = ? ? βα 其中 H=H(x,y,t)表示地表高程。 由于实 际区 域地 貌系 统的 过于复 杂与 庞大 , 计量 研究 中往往 不能 取得 数学 意义 上的精 确 解释 。 如 以上 的演化 模型 往往是 针对 某一 外力 过程 , 限 于极 为简 单、 理想 的 初始条 件并 且不 考虑介 质空 间差 异的 情形 ; 而 实 际 区 域 内 外 营 力 多 样化, 介质 不均 一, 甚 至 连 初始高 程 H 0 都 无法表 达成 确定 的函 数式 。 因 此只 能采 用适当 的方 式离散 化 , 化 无限为 有限 , 求 得尽 量逼 近 实况的近似解。 具 体 地说, 就 是 引 入 有 限 元 素法与 有限 差分 法的 思想 , 将整个 区域 地貌 体分 解成 许多 “微 小”的 单元 (姑 且称 之为 地貌体 ,其 顶部 地表 面称 之为地 貌面 ) ,如 图 14-12 所示。 在小 的 区域空 间内 以平 代曲 , 由 单个到 总体 , 最 终建 立整 个区域 上的 种种 普适 性更 强的分 析模 型以 求算各 种空 间地 貌参 数和 研究复 杂地 貌过 程等 问题 , 可以说 离散 化是 区域 地貌 信息系 统定 量 分析的前提与特色。 图 14-12:区域地貌离散分析 地貌是 构造 、 过 程和 时间 的函数 , 现 存地 貌形 态的 定量指 标及 其物 质组 成等 特点集 中反 映了地 貌系 统以 往内 外营 力共同 作用 的总 和 。 地 貌 信 息系统 分析 方法 就是 提取 地貌系 统各 不 同侧面 的特 征参 数, 采用 系统综 合分 析方 法取 得对 区域地 貌发 展规 律的 总体 认识。 地理 信息 系统方 法的 发展 , 使 得建 立地貌 信息 系统 , 对 庞大 复杂的 地貌 空间 数据 进行 定量分 析处 理和 信息复合与综合评价成为可能。 6. 2 地貌信息系统 地貌信 息系 统基 于 GIS 工 具开发 , 集 成 了 GIS 的通 用功能 , 并 包 括 如 下 地 貌 分析模 块: 1)地貌形态分析 用于提 取由 地表 形态 反映 出来的 地貌 特征 参数 ,包 括 DEM 以 及基于 DEM 的 各种地 貌 参数:坡度、坡向、起伏度、河网密度、沟谷参数等等。 2)地貌信息复合 包括地 貌参数复合模 型和地貌信 息 /专题信息复 合模型,前 者将各个地貌 参数复合, 发 现其间 的规 律性 , 得到 综合 的分析 结果 ; 后者 考虑 到地 貌格局 还受 到外 动力 地质 作用的 影响 , 将地貌信息与地质、水文、气象等信息复合,发现其联系。 3)地貌区域评价 根据单 个或 者多 个地 貌特 征的分 析, 评价 地貌 环境 对农业 、 建 筑、 工程、 旅 游 、 居 住条 件的影响以及评价地貌条件对于各种自然灾害发生、发展以及防治的影响。 4)地貌成因分析 包括: 内动力成因分析模型:内动力是地壳内部能量产生的营力,决定地貌的格局与骨架,可 以从几何效应和力学机制两个方面进行分析,有限元方法是研究地貌内动力成因机制的有效 方法。 外动力成因分析模型:外动力是地球表面受太阳能和重力以及生物活动的营力,主要包 括重力作用、风力作用、水利作用、温差作用和生物作用等,影响着地貌的具体形态。 5)地貌预测 可以采用两种模型进行地貌预测,即理论地貌预测模型和统计地貌预测模型,前者以成 因分析为基础,采用数理模型进行宏观和微观的模拟,预测地貌的发展;后者在地貌发展历 史数据的基础上,采用“黑箱”或“灰箱”的方法进行统计分析,预测地貌发展趋势。 7.医疗卫生 无疑,健康问题是人类生活中最为关注的问题之一,考虑到以下因素,在医疗卫生领域 应用 GIS,将有助于解决健康问题以及制订相应的政策。 1)某些疾病只是限于一些地区(地方病) ,探讨其局部的自然和社会条件,对于研究疾 病的原因以及治疗手段有着重要的意义。 2)医疗设施(医院、诊所、急救中心等)具有空间分布特性,在一个区域内合理分布 医疗设施有利于资源的有效利用。 7. 1 GIS 与流行病研究 由于流行病是用于描述和解释某种疾病的发病率,从空间的角度来看,流行病学需要很 好地描述流行病发病率空间分布特征的手段,进而可以研究发病率模型,以发现流行病和周 围环境的关系。通常,GIS 在流行病研究中主要提供了如下三个方面的功能: 7. 1. 1 流行病数据的可视化 假定要使用一组点来表示某个人群的发病率,而通常无法直接获得点数据,而只能获得 整个区域——如人口普查区或其它行政区划单元——的数据, 这些数据包括了疾病的发病率 及各疾病的年龄结构。 由于各个空间区域的大小各异,使得表现发病率的空间分布时不直观,一个解决的办法 是采用比较统计地图( Cartogram),在比较统计地图上,各个单元的大小与具有发病危险的 人口数目成比例,然后将发病率绘制在该图上,这样可以利用 GIS,清楚地将流行病数据的 空间分布可视化(图 14-13)。 图 14-13:宾西法尼亚州 1981-1988 年爱滋病的扩散情况, 图上灰色的区域成几何级数增长生动地表现了爱滋病的扩散 7. 1. 2 空间数据分析 实际上 , 空 间数 据可 视化 与空间 数据 分析 的界 限是 十分模 糊的 , 如 制作 比较 统计地 图需 要对地 理空 间进 行变 换。 由于各 个区 域人 口的 分布 是不均 匀的 , 为 了分 析流 行病病 例的 空间 分布,通常采用 的一种方 法称为密度估算 ( Density Estimation) 。该方法是 采 用一个移动 窗 口( Moving Window) 覆 盖于栅 格化 的位 置点 上, 计算每 个窗 口内 的密 度, 采用这 种方 法, 关键是 确定 窗口 的大 小。 此外 , 计 算发 病率密 度与 人口密 度的 关系 ; 以 及对 病例空 间分 布 进 行聚类分析( Cluster Analysis) ,并探讨每一特定聚 集区域具体特征,都可以 应用于流行病 数据的空间分析。 7. 1. 3 流行病模型 在识别 出每 个流 行病 的空 间分布 聚集 区之 后 , 一 个 重 点的研 究是 确定 流行 病和 其周围 环 境的关 系 , 这 将有助 于验 证对流 行病 发病 原因 的假 定。 做法 之一 是将空 气 、 水质的 空间 分布 与流行 病的 空间 分布 进行 对比研 究, 例如 在非 洲疟 疾传染 的研 究中 , 使 用利 用遥感 图像 计算 的 NDVI 指数 来进 行建 模 。 此 外为了 得到 流行 病的 源地 , 采 用 距 离 分 析 , 通 常是根 据预 先假 定的病 源地 进行 缓冲 区计 算, 然后 得到 每个 距离 范围 内的病 例数 目 , 进 而 确 定 真 正的病 源地 。 利用空 间分 析手 段确 定疾 病原因 , 最 著名 的案 例是 英国医 生琼 · 斯 诺利 用地 图发现 霍乱 病病 源: 1854 年 8 月到 9 月 英 国 伦 敦霍乱 病流 行时 , 当 局 始 终找不 到发 病原 因 , 后 来 医生琼 · 斯 诺博士 在绘 有霍 乱流 行地 区所有 道路 、房 屋、 饮用 水机井 等内 容 的 1:6500 城 区地图 上( 图 14-14) , 标 出了 每个 霍乱 病死者 的住 家位 置 , 得 到 了霍乱 病死 者居 住位 置分 布图 , 他 分析 了 这张图 , 马 上 明白了 霍乱 病源之 所在 —— 死者 住家 都集中 于饮 用 “布洛 多斯 托” 井水 的地 区 及周围 。 根 据 斯诺博 士的 分析和 请求 , 当 局 于 9 月 8 日摘 下了 这个 水井 的水 泵, 再往 后就 没 有出现新的霍乱病人了。 图 14-14: 1954 年英国霍乱病流行地区霍乱病死者居住位置分布图 7. 2 GIS 与医疗设施分布 7. 2. 1 医疗设施规划 不论是 在发 达国 家还 是发 展中国 家, 随着 “ 规 划 需 从 当地的 实际 情况 出发 ” 的 观点的 不 断被认 可, 一种 以医 疗中 心为主 的观 点也 不断 被采 纳。 这 意 味 这 不 再 为 了 所 谓声望 而投 资大 型医疗 基地 , 而 代之 以建 造更多 面向 小社 区的 诊所 , 以 方 便 大 众 。 这时, 显然 需要一 种办 法 来提供 人口 统计 和发 病率 的详细 资料 医疗 设施 需求 。 在进行 这种 医疗 设施 定 位 时 , GIS 可以 发挥的 重要 作用 。图 14-15 显示了 在英 国 west Sussex 的研究 中, 通过 确定 病 人到医 生的 流 量,从而对该地区医疗设施规划的合理性做出判断。 图 14-15:病人到全科医师的主要流动方向 反应了每个全科医师的“吸引范围” ( west Sussex) 在定义 医疗 需求 区域 后, 为了评 估当 地居 民的 需求 , 通 常 需 要 将 已 获 得 的 调 查统计 数据 进行社 会经 济分 类, 以便 更好地 描述 那些 小区 域。 这样, 拥有 不同 生活 方式 的不同 阶层 , 或 不同生 活方 式与 发病 率和 死亡率 之间 联系 的数 据就 可获得 。 然后 将标 准化 发病 率通过 这一 阶 层的情 况来 推及 个人 , 从 而产生 综合 疾病 指数 应用 于实践 。 这 个综 合疾 病指 数可用 于预 测病 人药品的开销等方面。 7. 2. 2 可达性,可用性及结果 GIS 在理 解医 疗结 果与 医 疗设施 可达 性的 关系 方面 很有帮 助。 对 于 一 些 疾 病 , 如交通 事 故, 迅速 送往 医院对 于病 人的抢 救至 关重 要, 这需 要医院 具有 良好 的可 达性 , 对 于可 达性 与 医疗关系的探讨,同样有助于规划医疗设施。 7. 3 联系流行病学与医疗实施规划 —空间决策支持系统 在医学 地理 学中 , 地 理流 行病学 和医 疗设 施规 划是 两个最 主要 的领 域。 建立 两者间 的桥 梁, 需 要 包 括 空 间 决 策 支 持系统 , 如 果分 析显 示在 特殊的 局部 区域 存在 健康 问题, 此时 , 空 间决策 支持 系统 将提 供工 具及策 略来 处理 这一 问题 。 在 研 究中, 发现 以下 问题 是值 得 注 意 的 : 1)地图 的比例 尺,小 比例 尺的地图 会掩 盖许多 细部 的重要问 题, 如小区 域间 发病率 的 变化。大比例尺地图则可使有关当局集中力量于最需要他们的区域。 2)疾病 的传播 是无国 界的 ,随着人 类活 动的扩 展, 疾病也随 之传 播,通 过对 人口流 制 图,可以研究疾病的传播规律。 8.军事 军事是 以准 备和 实施 战争 为中心 的社 会活 动 。 一 切 军 事行动 都是 在一 定的 地理 环境中 进 行的, 地理 环境 对军 事行 动有着 极其 重要 的影 响与 作用。 随着 人类 社会 向信 息化迅 速发 展 , 未来高技术战争中信息对抗的含量将越来越高,特别是高技术条件下的局部战争,由于战争 爆发突然,战争进程加快、战机稍纵即逝等特点,对作战指挥的时效性有了更高的要求。指 挥决策智能化、作战指挥自动化、武器装备信息化成为未来战争取胜的关键。在这种需求下, 出现了数字化战场,数字化的地理环境信息已成为指挥决策的必要条件之一。因此,作为空 间军事信息保障的军事地理信息系统已成为现代化军事斗争的一项重要内容。 军事地理信息系统 MGIS(Military Geographic Information System )是地理信息系统技 术在军事方面的应用,是指在计算机软硬件的支持下,对军事地形、资源与环境等空间信息 进行采集、存储、检索、分析、显示和输出的技术系统。它在军事地理信息保障和指挥决策 中起着重要的作用。 军事地理信息系统和遥感、全球定位系统关系密切,同时和指挥自动化系统 C 3 I (Command ,指挥;Control ,控制;Communication,通信;Information ,情报)紧密地联 系在一起,形成一个多功能的统一系统。它一般由六个子系统组成:信息收集子系统、信息 传递子系统、信息处理子系统、信息显示子系统、决策监控子系统和执行子系统。其中,情 报是军事决策的基础;信息收集、处理和显示是系统的核心;通信和控制是信息传输和决策 过程的保证;指挥使军事决策具体执行。地理信息系统技术在情报的收集、处理、显示和指 挥决策方面发挥着重要的作用。 另外,由军事技术革命引发的数字化战场建设已成为未来战场发展的主流,建设数字化 战场和数字化部队已成为 21 世纪军队发展的大趋势,引起了各国的普遍关注。美国著名未 来学家托夫勒指出,建设数字化战场是一项比研制原子弹的“曼哈顿工程”更具挑战性的系 统工程, “数字化战场是打赢信息战的关键” 。战场数字化就其内容来讲,主要是战场地理环 境的数字化、作战部队的数字化、各种武器的数字化和士兵装备的数字化。从某种意义上来 讲,战场地理环境的数字化是其他数字化的基础,它为作战部队和各种武器装备的数字化提 供了必需的战场背景环境和空间定位基础。 8. 1 国外军事地理信息系统(MGIS )现状 军事地理信息系统在海湾战争及以后的战争中发挥了重要的作用, 受到了各国军方的普 遍重视。世界上大部分国家都建立了用途不同、规模大小不等的军事地理信息系统。报道较 多的是美国、俄罗斯、英国、澳大利亚等国的 MGIS。其应用领域包括: 1)基础地理信息 包括地形图、DEM 、DTM 等。 2)航海、航空管理 航海图、制定计划航线、障碍物、禁区、助航设施、导航管理、空 中交通控制等。 3)地形分析 包括战场模拟、行军路线、应急线路分析、越野机动、涉水分析、通视点 分析、距离量测、面积量测、武器打击轨迹分析等。 4)任务规划(战略层次) 包括军事基地规划、军事基础设施管理、打击效果评估、巡 航导弹支持、战区规划、入侵应急规划、目标分折、轨道建模等。 5)战争管理(战术层次) 包括战场监测、战场管理、小战区规划、登陆计划、战术模 拟、后勤保障规划、交通规划等。 6)基础作业支持 包括拦截应用、环境应用、军事设施分类规划等。 7)边界控制 包括边界巡逻和交叉分析、毒品禁运、移民控制等。 8)情报 包括反毒品活动、反恐怖主义活动、武器监视与跟踪、情报收集等。 8. 2 国外军事应用系统示例 美国国防制图局( DMA, Defense Mapping Agency)是美国军事 GIS 的管理部门, 1989 年以来投入大量的人力和物力来开发军事 GIS 系统。例如: 1)数字航海图 数字化海图(Digital Navigation Chart ,DNC )和 GPS 结合用于海军的 导航,来取代以前使用的 4500 张纸质海图。这些数字地图可以支持广泛的空间分析和地理 查询。数字化海图一般包含有 12 个特征数据库:地名注记、水文要素、界限、港口设施、 水下地形、航道、航海标志、救援标志、海洋环境、陆地地形地物、航海障碍物、数据的优 先级。 2)数字地图 VMAP ( Vector smart MAP)数据分两个层次,分别对应于 1: 25 万比例 尺和 1: 5 万比例尺的地形图。该系统包括有 10 个数据层:交通、网络、界限、水文、城市、 公用设施、植被、等高线、工业设施。 3)水文资源评估系统 用于水文和测深数据的收集。 实际上,由于军事保密的特殊性,我们对国外许多功能强大的 MGIS 了解得都很少。作 为军事情报的一个设施,美国正在建立和完善军事应用的全球空间信息和服务( Global Geospatial Information and Services, GGI&S)系统。其中的数据包含两个层次,国家性的和 全球性的,符合 NOTA DIGEST、ISO TC/211 以及 OGIS 标准。 另外,英国国家遥感中心(British National Remote Sensing Center , NRSC )应用法国 的 SPOT 图像与 MGIS 结合,模拟敌方的三维地形,对军方飞行员进行模拟训练,取得了较 好的效果。 海湾战争的实践证明,利用 MGIS 技术和遥感技术相结合,可为战时提供实时的地理信 息保障。美国国防制图局(DMA )在海湾战争的战场上的 MGIS 实时服务,主要包括利用 自动影像匹配和自动目标识别技术处理卫星和高低空侦察机实时获得的数字影像, 及时地为 军事决策提供 24 小时的实时服务。对于冲突地区,最基本的地理信息保障是为作战部队提 供作战地图。与传统的地图制图技术相比, MGIS 的制图功能无疑是出色的,它既可以提供 数字地图,也可以输出精美的印刷地图,其生产速度比传统的制图方法要快得多,特别是在 遥感技术支持下,可实时地获得制图数据。在海湾战争期间,美国国防制图局进入一天 24 小时生产状态,共开发了 12000 套新的地图产品,其中 600 套数字地图,印刷了 100 万幅战 地地图,这些地图覆盖科威特、沙特阿拉伯、伊拉克、叙利亚等国和地区,比例尺为 1: 5 万不等。由于对这些战地地图的迫切需要,多国部队在这次战争中使用 C130 远程运输机运 送军事地图到沙特阿拉伯,优先于药品的运输,仅次于爱国者导弹发射架部件的运输,由此 可见,战时的实时地理信息保障是何等重要。 除上述地图产品外,美国国防制图局和工程地形实验室还使用了数字地形高程数据、栅 格图形数据、 地名字典等。 在没有现成地图资料的地区, 利用 MGIS 处理 SPOT 和 LANDSAT 影像及机载雷达影像,得到可直接应用的影像地图。因此,MGIS 和 RS 相结合,可较好地 完成战时的实时地理信息保障任务。 8. 3 MGIS 的发展方向 概括而言,军事地理信息系统有以下的发展趋势,以便更能够满足现代战争的要求: 1)基础数据、基础设施大型化。 2)各领域应用专业化。 3)实用化,简单化,易学易用。 4)小型化。 5)标准化。 三个法国士兵打不过两个马穆鲁克人,100 个法国士兵可以与 100 个马穆鲁克人 站成平手,200 个法国士兵则绝对可以战胜 300 个马穆鲁克人. 拿破仑 第十五章 地理信息系统应用项目组织和管理 导读:本章首先简单概括了GIS应用项目,提出了GIS应用的三元划分,然后介绍 了几种GIS应用的建立途径以及项目周期。在项目开始之前,需要进行策略性规划 和实施规划,如果要进行项目承包,则要签订合同;在GIS项目进行过程中,要进行 人员管理,数据管理以及质量控制,本章根据GIS具体技术特点,提出了相应的建 议。在最后,介绍了软件研制和开发的质量控制的两个标准,ISO9000系列标准和 CMM模型,作为项目开发机构的指导。 本章和地理信息系统软件工程技术一章讲述的内容是互相依赖的,后者重点在于技 术,而本章则侧重于组织和管理,往往组织管理对项目成败的影响比所采用的技术 更大。 1. GIS 应用项目简介 1. 1GIS 应用模式与分类 地理信息系统可以区分为通用地理信息系统平台和面向特定专题或地区的 GIS 应用, 前者提供了基本的空间信息处理方案,可以应用于各个领域,一般由专门的软件开发商完成, 其开发过程类同于普通软件系统(如数据库管理系统、桌面出版系统等等)的开发;而后者 往往针对某个用户单位提供特定的技术手段。具体而言, GIS 应用按照其应用模式又可以分 为两类,即科学研究工具和办公服务系统两种。 1)科学研究工具 将 GIS 作为科学研究工具的应用模式,强调对于科学计算结果的获得和分析,把 GIS 作为科学研究的辅助手段。它主要应用于有关地学领域的科研项目研究中。它不仅需要用到 地理信息系统通用软件所提供的功能,而且还要用到各种专业分析模型。 2)办公服务系统 办公服务系统应用于涉及空间数据的政府部门以及企业,以提高管理效率、制定好的决 策和实现组织目标。 办公服务系统按照其应用层次的高低,又可以分为空间事务处理系统(STPS-Spatial Transaction Process System),空间信息管理系统 (SMIS-Spatial Management Information System),空间决策支持系统 (SDSS-Spatial Decision Support System)和专家系统( Expert System)。 事务处理系统的目标是迅速、及时、准确地处理大量空间信息,能够有效地进行日常事 务的自动化处理。它注重于空间数据的收集,处理和存储,以供将来使用在各种大型应用地 理信息系统的数据采集部门和具体事务部门都有着广泛的应用,包括测绘、资源调查、地籍 管理、地图出版等领域。 空间管理信息系统是基于空间事务处理系统发展起来的, 除了提供高效率的信息处理以 外, 还对 决策 者提 供辅 助决 策 信 息 , 包括 数据 的查 询和统 计以 及专 业模 型的 分析功 能。 SMIS 运用专 业模 型来 处理 和分 析数据 , 以 实现 对业 务工 作中确 定性 问题 的处 理和 管理, 提供 决策 服务。 SDSS 为 决 策 者 提 供 了 一 个 模拟决 策过 程, 并提 供了 选择方 案的 决策 支持 环境 , 强 调 系 统推理的有效性,更多地应用于宏观决策过程。 专家系 统是 能够 模仿 人工 决策处 理过 程的 基于 计算 机的信 息系 统 , 它由 知识 库、 推理 机、 解释系 统 、 用 户接口 和知 识获得 系统 组成 。 它 扩大 了计算 机的 应用 范围 , 使 其从传 统的 资 料 处理领 域发 展到 智能 推理 上来。 SMIS 能够提 供信 息帮助 制定 决策 , SDSS 帮助能 够改 善决 策质量,只有专家系统能够应用智能推理制作决策并解释决策理由。 上述应 用模 式之 间的 界限 并不是 绝对 的 , 一 个 决 策 支 持系统 可以 使用 与科 研工 具中一 致 的分析 模型 ,并 且广 义上 讲,所 有的 地理 信息 系统 应用的 最终 目标 都是 为了 进行空 间决 策 。 除了从 应用 模式 上划 分 GIS 应 用 , 从规模 上划 分为 小型、 中型 和大 型应 用。 小型 GIS 使用数 据量 小 , 使用 系统 的用户 少 , 主 要针对 一个 部门或 特定 领域 , 注 重于 专业模 型的 开 发 和应用 。中 型 GIS 应用于 多个部 门, 数据 量大 ,运 行于局 域网 或城 域网 环境 ,侧重 于决 策 支持。 大型 的 GIS 应用则 拥有非 常多 的用 户和 海量 的数据 ,注 重数 据的 管理 ,并通 过网 络 实现分布式的计算和数据管理,并通过 Internet 发布空间信息。 另 外 , 再考 虑到 GIS 具体 应用的 领域, 可以 对 GIS 应用进 行三 元划 分 ( 图 15-1) ,每 个 GIS 应用都对应于该三维空间特定的坐标(表 15-1) 。 图 15-1:地理信息系统应用的划分 表 15-1: GIS 应用的三元划分示例 名称 规模 应用模式和层次 领域 XX 小流域水土流失系统 小型 科学研究工具 环境 XX 城区土地划拨系统 中型 空间事务处理系统 地籍 XX 林场管理系统 中型 空间管理信息系统 林业 XX 大城市市政管理系统 大型 空间管理信息系统 城市管理 XX 省可持续发展决策支持系统 大型 空间决策支持系统 资源与环境 从应用领域的角度对 GIS 的划分 GIS 的数 据模 型可 以划 分 为场模 型和 要素 模型 , 图 15-2 表示了 这两 类模 型在 不同领 域 的应用。 GIS 应用 基于 场的 基于 要素 的 地图 模型 DTM 规划 和设 施管 理 风险 灾害 模型 地景 制图 灌溉 土地 评估 粮食 估产 地球 科学 和资 源规 划 民用 工程 和军 事 土壤 调查 水利 模型 水资 源管 理 污染 控制 洪水 控制 土地 资源 管理 消费 产生 和服 务 市场 分析 设施 管理 汽车 导航 图 15-2:根据场模型和要素模型对 GIS 应用领域进行划分 [N.R. Adam& A Gangopadhyay] 1. 2 开发 GIS 应用的方式 一旦组 织决 定建 立用 于本 单位的 地理 信息 系统 , 可 以采取 三种 方式 , 一 是通 过购买 , 在 组织中 实施 ; 二是请 软件 开发商 来开 发 ; 三是 由组 织内部 的人 员开 发, 可以 是专业 的地 理 信 息系统人员,也可以是最终用户。 其中购 买 GIS 又可以 分为 购买 GIS 平台软 件进 行二 次开发 ,购 买完 整的 软件 产品, 购 买完整的 GIS 系统以及购买 GIS 服务。 请软件 开发 商进 行开 发以 得到完 整的 软件 产品 或系 统, 也可 以认 为是 系统 购买 的一种 形 式, 但是 从购 买到系 统运 行时间 比直 接购 买时 间要 长。 在请 开发 商进行 开发 时, 可以 有两 种 具体方 式, 即承 包开 发和 合作开 发。 前者 由开 发商 独立开 发完 整的 系统 ,又 称为“ 交钥 匙 ” 系统; 后者 在开 发过 程中 , 可 以 由 用 户 方 的 技 术 人 员参与 开发 , 双 方合 作完 成整个 系统 , 这 种方式有利于开发系统时对问题域的准确把握。 上述 的 GIS 应用 建立 方式各 有 利 弊 ( 表 15-2) , 各 个 组织可 以根 据具 体情 况确 定采用 何 种方案。 表 15-2:建立 GIS 应用方案的比较 [据 Aronoff 扩展 ] 实施 方案 用户 开发 购买通用 平台 购买完 整软件 购买完 整系统 购买 服务 承包 开发 合作 开发 对提供者依赖性 低 低 高 很高 很高 很高 中 到系统运行时间 长 长 -中长 短 很短 很短 长 -中长 长 -中长 初始费用 低 中等 中等 高 高 高 中等 人力费用 高 中等 低 低 很低 低 中等 风险和不确定性 高 较低 低 低 中等 高 中等 灵活性 完全可以 完全可以 中等 中等 不定 高 完全可以 对用户技术要求 很高 高 中等 中等 很低 中等 高 现有资源的利用 高 高 中等 低 很低 低 中等 -高 1. 3 GIS 应用项目 如果要 建立 GIS 应用 的组 织不是 购买 现成 的、 直接 可以使 用的 GIS 系统 ,那 么就意 味 着要进 行系 统开 发工 作, 无论系 统是 自行 开发 , 还 是承包 开发 、 合 作开 发。 从 开始确 立需 求, 到最终的系统投入运行,这一个时间段内的活动统称为 GIS 应用项目。 通常一 个项 目包 括四 个阶 段, 识 别 需 求 , 提 出 解 决 方案, 执行 项目 以及 结束 项目, 这四 个阶段构成了项目的生命周期(图 15-3) 。 图 15-3:项目生存周期 [J. Gido] 识别需 求由 准备 建立 GIS 应用系 统的 组织 进行 ,包 括认识 当前 组织 的存 在问 题,准 备 用 GIS 解决哪个方面的问题,分析项目可行性以便进行项目预算等方面的问题。 如果是 用户 方自 行开 发建 立 GIS 应用 ,那 么提 出解 决方案 、执 行项 目以 及结 束项目 都 是由用 户方 来完 成。 如果 需要由 GIS 开发 商进 行开 发,那 么需 要向 他们 征询 解决方 案, 并 签订合 同 , 前 者可以 通过 招标的 方式 进行 。 在 签订 项目合 同之 后 , 项目 执行 主要由 开发 方 负 责,用 户方 配合 开发 方的 工作, 直至 整个 项目 结束 。图 15-4 描述了 这两 种地 理信息 系统 建 立过程。 项目 需求 策略 性规 划 实施 性规 划 子项 目和 进度 计划 里程 碑一 项目 结束 A 用户 开发 商 B 签订 开发 合同 系统 交付 安 装 人员 、数 据、 程序 开发 、财 务管 理 图 15-4:地理信息系统项目过程 ( A:表示用户自行建立系统; B 表示通过招标由 GIS 开发商建立) 2.应用项目策略性规划 越来越 多的 机构 都在 开 发 GIS, 但 是 根 据 调查, 有大量 的 GIS 系统 不能 真正 地 完成并 正 常运行 , 造 成 这些项 目失 败的大 都不 是由 于技 术上 的问题 , 而 是 组织和 管理 中的问 题 , 而 不 能进行 细致 的项 目规 划是 根本的 原因 。 项 目规 划包 括策略 性规 划和 实施 性规 划, 前 者 在 项 目 正式启动之前进行,而后者则往往是项目实施的第一步工作。 造成地 理信息 系统 开发失 败的因 素 [村井 俊治 ], 从 相 反的角 度说 明了 如何 才能 开发一 个成 功 的地理信息系统应用。 缺 乏远见 缺乏长 远规划 个人冲突 没有协作精 神 缺少决策者 的有效支持 错误的选择 错误的使用 没有进行咨 询 没有总 体目 标 没有任 务目 标 没有应 用目 标 没有软件版 本升级 没有数据的 更新 没有模型的 改进 没有培 训 没有手 册 没有用 户参 与 没有使用系 统方法 没有反复试 验修改 缺 少用户 介入 失败 的 GIS 缺少专业 知识 缺少系 统分析 图 15-5:造成地理信息系统开发失败的因素 应用项 目策 略性 规划 工作 对应于 项目 生命 周期 的识 别需求 阶段 , 主要 目的 是确 定要建 立 怎样的 GIS 应用 ,组 织现 有的条 件, 包括 资金 、人 员、设 备、 场地 等等 ,能 否支持 GIS 的 建立和 应用 。如 果用 户自 行开发 GIS 系统 ,可 以包 括系统 开发 方案 的选 择; 反之, 一般 由 开发方提出解决方案。 GIS 项目策略性规划一般包括五个主要部分: 1)机构的状况分析和调查 从 GIS 的 角 度 了 解 一 个 机 构目前 的组 织、 任务 和技 术状况 , 包 括责 任范 围, 发展目 标, 技术力 量, 对使 用信 息技 术和 GIS 的态度 ,人 力、 物力和 资金 状况 等等 。状 况分析 和调 查 为下一步计划提供了概念化的基础。 2)机构的 GIS 系统开发目标 明确定 义整 个机 构 GIS 总的发展 方向 ,这 个方 向应 当与整 个机 构的 任务 和责 任范围 一 致, 并 且 应 当 对 整 个 系 统 各方面 的能 力作 出明 确的 定义。 制定 总方 向的 过程 需要机 构内 高程 管理人员的参与,他们对于整个系统开发的必要性的理解和认识会对整个系统的发展有所帮 助。 3)系统开发的可行性 主要包括资金、技术力量和组织运作三个方面。资金的分析应当考虑到整个 GIS 实施、 运行和维护的全过程,通用的方法是成本效益分析。在技术可行性方面,要考虑 GIS 项目 中所要求的技术能否满足,技术发展以及新技术出现对项目的影响,是否需要对人员进行技 术培训。组织方面,包括整个机构能否愿意承受引入 GIS 技术所带来的变化以及能否在开 发过程中相互协作完成开发任务。 在进行可行性分析时,不可忽视各个方面的变化所引发的风险,要对风险进行客观的评 价,并作出相应的防范措施。 4)系统开发的方案选择 系统开发的方案选择覆盖了 GIS 系统的各个方面,包括数据部分、功能部分、系统的 整个软件和硬件的框架等,以确定各个方面的实施部门、进度安排和管理方法等等。 5) GIS 系统决策规划书的起草 方案确定之后,需要将方案起草成文件形式,由有关部门审批,同时也可以作为系统规 划和实施的指导性文件。 在策略性规划完成并得到批准之后,如果是由用户自行开发系统,则可以直接进行下面 的开发工作;如果需要由另外的 GIS 开发商合作开发或承包开发,则可以以需求建议书( RFP, Request for Proposal)的形式提交给开发商,而开发商将其作为进行需求分析的重要依据, 此外,在合同中也体现了策略性规划的部分成果。 3.应用项目合同 如果用户单位确定由其它软件开发商承包或合作开发 GIS 应用软件系统以及向开发商 购买现成的软件系统,则需要由双方签订关于本次开发或购买——统称为软件贸易——的技 术合同。技术合同确定了贸易的目的,双方的权利和责任等多个方面的内容。在中国,技术 合同的签订、执行、变更与终止需要在《著作权法》和《技术合同法》中的有关原则的规范 下进行。 由于当事各方的具体情况不同,合同的具体内容和形式也不同。一般而言,采用双方合 作开发的形式,因为用户拥有部分版权,合同中对于用户限制较小;而采取“交钥匙”的开 发方式或者直接购买软件,则对作为接受方的用户 * 的限制较为严格。具体地,软件技术合 同通常所包含的条款有: 1)引言 是合同的第一个条款,包括合同签订日期,当事双方名称、地址,合同背景。 2)定义 在定义部分,对一些关键性的用词进行定义,避免双方对合同中用词和概念的不一致带 来纠纷。对于信息系统技术合同,需要进行定义的名词包括“被许可软件”,“文档”等等。 对于“被许可软件” ,需要指明软件名称、版本、形式(目标代码,源代码) ;而对于“文档” , 要说明它是用户手册,还是工程文档,或者两者都包括。 3)标的 说明了开发系统名称、合作开发方式、使用许可以及系统的技术规格。技术规格又包括 * 在本节中,“用户”并不仅指单纯的系统使用者,也包括为了赢利而销售应用系统的单位。所以一般称为 接受方,而软件开发单位则称为供应方。 软硬件环境,功能描述和性能说明。 4)授权及限制 该部分规定软件供应方和接受方的权利以及对这些权利的限制,在每一项具体的合同 中,用户方获得的授权内容和限制是不一致的。在技术合同中,授权包括: (4. 1)使用权:软件使用权是通过许可合同授予用户最主要的权利,是签订许可合同 的标的,不过作为供应方可以对使用权增加一些限制,包括运行环境,数据等等。 (4. 2)分销权:如果接受方不是最终使用用户,可以经销系统,则需要在合同中确定 其分销权。 (4. 3)独占性:使用权和分销权可以是独占的,也可以是非独占的。分销权独占性一 般只是在一个地区范围内和行业范围内成立。 (4.4)复制权:对用户制作合法拷贝备份的规定。 (4. 5)修改权:一般来说,获得使用权或分销权的用户都无权修改供应方提供的软件。 不过,根据实际的情况,可以在合同中作出更为合理的规定。 对于专业 GIS 应用软件,由于一些专业模型需要由用户提供,并且需要修改,一般规 定用户有修改权,以改进模型,但在这时要对供应方的维护责任作出规定。 (4. 6)对许可合同的转让权:被许可人可以将许可合同赋予自己的全部权利转让给第 三方,但是只能转让一次,并且需要征得供应方的同意。 (4.7)对计算机系统的限制:通过限制软件运行的计算机系统防止系统扩散。 (4.8)地区限制:限制合同的运用地区。 5)交付与安装 明确规定供应方提供软件——包括程序和文档——的具体内容,对于程序,需要说明是 否包括源代码;文档要说明包括哪些具体文档;同时对于是否由供应方将应用软件安装在计 算机内。 6)移交与验收 为了保证接受方得到的系统是可以实际使用的,在合同中必须对软件的移交和验收作出 安排。 7)培训 如果需要供应方为接受方承担培训工作,则应在合同中设置培训条款,包括培训时间、 内容和费用承担等。 8)维护 在任何软件技术合同中,都要包括维护条款,维护包括纠错性维护、适应性维护和完善 性维护,合同中首先要注意的是纠错性维护。维护条款包括修正错误的时间,费用承担,同 时规定哪些情况不在供应方维护范围内。 9)期限 期限规定了合同的有效时间。 10)报酬与支付 在报酬和支付部分包括三个方面的问题: 支付方式、 费用支付针对哪些软件产品和服务、 支付时间。例如,对于最终用户,采取的支付方式包括依次性固定支付,周期性固定支付和 根据运行情况进行支付三种方式。 11)纳税 该部分规定的各项税款的承担单位。 12)所有权的归属 一般而言,接受方只是获得了软件的使用权,所有权并没有转让。但是在合作开发中, 可以根据具体情况规定所有权归属。另外,在承包开发的情况下,为了保护接受方权益,可 以规定所有权属于制定的委托方。 13)保密与限制竞争 在承包开发过程中,双方都有可能使用对方的机密,需要规定保密责任。 14)担保和赔偿 担保是指供应方对自己所供应软件的担保,包括功能、性能以及版权等方面。如果所做 保证不能实现,则要向接受方提供损害赔偿。 15)违约处理 规定了合同双方发生违约时的处理,包括终止合同以及赔偿等等。 16)争议处理 在合同执行中出现争议的处理,通常的做法是提请拥有计算机技术方面的专家仲裁裁 决。 17)终止 如果合同没有确定期限,规定合同在哪些情况下终止以及合同终止后双方要做的事情和 继续承担的责任。 18)条款的完整性 强调条款的完整性,未在合同中的内容,一律不能成为本次软件贸易的组成部分。 19)不可抗力 由于出现不可抗拒因素而影响合同的执行,通常一方应给予谅解并适当延长履行合同期 限。 20)法律的选择 如果双方属于不同的国家,要说明发生纠纷时采用哪个国家的法律。 21)生效 一般合同签字后即可生效,在有些情况下,需要由有关部门批准后方可生效,在本条款 中加以说明。 上面是软件技术合同的一些基本条款,除此之外,还往往包括一些附件以详细说明具体 的技术问题。 4.应用项目实施性规划——软硬件配置 应用项目开始之后,就要进行实施性规划,在这一阶段,主要要确定系统软硬件设计。 如果不是完全自行开发系统,软件设计过程中要进行软件配置, 反之要进行软件的总体设计。 在进行软硬件配置时,主要考虑的因素有: 1)系统数据量; 2)用户数目,并发访问情况; 3)现有网络环境; 4)投资规模; 5) GIS 应用在整个系统中的位置,是一个纯粹的 GIS 系统还是与其它系统结合而成的 综合信息系统。 这些因素,在策略性规划阶段就已经基本确定,此时要根据这些因素进一步选择软件以 及硬件设备。在进行软硬件配置时,除了上述因素外,可以参照以下原则: 1)不要只重视硬件,而忽视软件的选择; 2)保护已有的投资,包括软件、硬件设备、数据等; 3)保证系统的可扩充性; 4)考虑技术的发展方向; 5)如果要进行二次开发,要着重考虑软件的二次开发支持能力; 6)重点考虑软硬件功能能否满足项目需求; 7)性能也是不可忽视的重要因素。 8)选择软硬件的功能必须要满足系统要求,而性能指标可以事先界定,通常系统的性 能与投资多少直接相关,这就需要根据投资数额确定一个最佳性能 /投资比,不至于引起浪 费或者不能满足项目要求。 下面给出了进行 GIS 软硬件配置时的一些具体的意见(表 15-3)。 表 15-3:GIS 软硬件配置时的一些具体的参考意见 项目 具体考虑因素 软件 数据量 数据的分布性 已有数据 需要二次开发 系统需要与其它软件协作 现有的软硬件平台 需要与 Internet 结合 硬件 数据量大,并且需要共享 数据需要定期备份 大量的数据录入 地图输出 高质量、大幅面地图输出 数据采集 移动计算 已选择的软件 网络 局域网 远程访问 接入 Internet 如果数据量大,要关注软件对大数据量处理的性能,是否 支持图库 如果数据是分布管理的,需要软件支持网络 软件能否顺利地读入现有的数据 软件是否具支持二次开发,支持方式( API,控件,宏语 言) 软件对数据库是否支持 软件必须能够运行于现有的软硬件平台上 软件是否支持 Web,具体方式(ActiveX,Java 等) 选择数据服务器 磁带机,光盘课录机 扫描仪,数字化仪 彩色喷墨打印机 喷墨绘图仪,其它高档绘图仪 GPS 接收机,平板测图仪 笔记本电脑 使软件能够运行良好的硬件平台 细缆线/ 双绞线,集线器 拨号网络支持 各种专线 5.子项目划分和进度安排 在一个较大规模的地理信息系统建设过程中,由于要涉及各个部门,功能和数据数据的 形式多种多样,并且要涉及不同的软硬件平台,需要在项目实施之初,制定计划以协调各个 方面的问题 * 。通常,计划中最重要的内容是划分子项目以及整个项目进度的安排。 5. 1 划分子项目 子项目的确定是整个 GIS 系统设计过程中最重要的环节之一,子任务的合理制定使得 各方面的细节不至于遗漏,使整个计划、 预算和质量得到保证。子项目不仅要包括技术任务, * 到项目开始执行,不再区分用户方和开发方,原因是无论由哪一方进行开发,进行的项目组织管理工作 都是相似的。 而且要包括各种非技术的任务,包括管理、支持等等。划分子项目时,可以按照整个项目、 项目、任务、子项目、具体工作、步骤等六个层次,进行自顶向下地划分。表 15-4 列出了 常用的 GIS 项目任务。 表 15-4:常用的 GIS 项目任务[ 宫鹏] 项目规划 1. 可行性分析 2. 市场调查 3. 技术调查和评价 4. 起草报告 试点项目 1. 数据收集 2. 数据数字化 3. 数据转换 4. 数据质量控制 5. 制图 6. 设备购买 7. 设备安装 数据库生成 1. 数据库概念设计 2. 数据库详细设计 3. 数据收集 4. 数据数字化 5. 数据转换 6. 数据编辑 7. 数据质量控制 8. 数据修改 9. 自动化编程 数据输出 1. 制图 2. 数据制表 3. 自动化编程 GIS 分析 1. 分析模型定义 2. 分析模型的过程设计 3. 分析模型实施 4. 分析制图 5. 分析制表 6. 分析自动化编程 7. 分析报告生成 应用系统开发 1. 系统的用户需求分析 2. 系统的设计 3. 系统设计报告起草 4. 系统编程 5. 系统测试 6. 系统运行报告和安装 7. 系统培训 8. 系统的用户报告 9. 系统维护报告 10. 系统维护的技术服务 其它 1. 人员技术培训 2. 项目管理 3. 系统维护 4. 数据安全备案 5. 项目技术会议 6. 项目中期报告 7. 项目终期报告 5. 2 进度安排的原则和表示方法 项目进度安排是管理者在进入设计和实施阶段之前需要完成的,要在时间和顺序上安排 各个子项目。在进行进度安排之前,首先必须估计每项活动从开始到完成所需要的时间,其 次要考虑的因素包括活动之间的依赖关系(必须完成一项才能进行下一项)以及各个活动的 最早开始——结束时间和最迟开始——结束时间(例如:整个项目工期为 120 天,某项活动 需要 30 天,那么它的最迟开始时间是第 90 天)。计划要有灵活性,可以根据变化进行相应 的调整;此外,要保证参与人员有足够时间来完成各项任务,在任务之间安排一定的“机动 时间”是一个较现实的办法。 表示项目进度的常用方法有里程碑表示法(Milestone Chart) ,甘特图法( Gantt Chart), 关键路径法(CPM-Critical Path Method )和墙纸法(Wall Paper Method )。 5. 2. 1 里程碑表示法 里程碑 表示 法适 用于 较小 规模的 项目 , 可 用于 起草 项目计 划书 , 该 方法 将主 要任务 作为 一个阶 段来 处理 , 清 晰并 且容易 使用 。 缺点是 不能 表达出 各项 任务 之间 的关 系, 对项 目进 程 的控制能力差。表 5 给出了该方法的样本。 表 15-5:里程碑表示法 任务编码 主要内容 负责小组 预计完成日期 实际完成日期 5. 2. 2 甘特图法 甘特图 法又 称直 方图 法、 柱状图 , 是 目前 使用 较多 方法, 它容 易表 现活 动的 时间长 短和 先后顺 序, 但是 不能 描述 影响关 系, 难以 进行 复杂 项目的 控制 。图 15-6 是甘 特图法 的一 个 例子。 1998 年(季度) 1999 年(季度) 任务内容 和编码 一 二 三 四 一 二 三 四 项目规划 试点项目 1. 数据收集 2. 数据数字化 3. 数据编辑 4. 质量控制 应用软件开发 1. 分析模型定义 2. 模型定义 3. 编程实现 项目管理 图 15-6:甘特图法表现项目进度 5. 2. 3 关键路径法 关键路 径法 表达 了项 目中 各个任 务之 间的 先后 顺序 和制约 的双 重关 系 , 适 用 于 对大型 的 复杂项 目进 行进 度控 制。 采用关 键路 径法 需要 管理 人员对 子项 目之 间的 关系 十分清 楚, 其缺 点是不够灵活,并且制作烦琐。 5. 2. 4 墙纸法 墙纸法 主要 适用 于有 较多 人员参 加的 项目 类型 , 它的 特点是 直接 对每 个具 体人 员安排 任 务。 采用 墙纸 法制 定项 目进度 时 , 需要 一开 始就 有有 关 项目人 员的 参加 , 便 于 发 挥 其主动 性。 在进度安排时,可以利用计算机软件辅助进行,使进度更加合理。 6.项目预算 6. 1 项目预算的主要内容 项目预 算是 起草 项目 计划 书时必 须做 的一 个步 骤, 也是 GIS 项目管 理人 员最 常做的 事 情 之 一 。 一 般来 说, GIS 项 目的支 出主 要有 七类 , 与 某一 GIS 项目 直接 发生 关 系的费 用称 为 直接项目费用,否则被称为非直接项目费用。 1) 人 力费 用: 指拥 有和 使 用人力 资源 来完 成任 务的 费用 , 主 要包 括员工 的工 资和福 利, 人力费用属于直接项目费用。 2)材料和办公用品费用:包括购买各种办公用品、书籍、图件等的费用。 3)设备费用:主要包括计算机硬件的购买或租赁费用。 4)软件费用:计算机软件的购买或租赁费用。 5)软件和硬件维护费用。 6)内部 服务费 用:主 要包 括机构内 部某 些部门 的维 持费用, 它们 间接支 持项 目和整 个 机构的运行。此外,还包括保险、办公场所租赁、通讯费用等等。 7)其他费用:不属于以上任何一类的费用,包括旅行费用、培训等。 上面除 人力 费用 属于 直接 费用以 外, 其他 都属 于非 直接费 用, 在计 算时 可以 用人力 费用 乘以一个权值以估算非直接费用。 6. 2 项目预算的方法 在进 行 GIS 项 目 预 算时, 要综合 考虑 各种 费用 , 进 行预算 的方 法主 要有 四种 : 上 溯 法 , 下溯法,单价法和根据项目参加人员的费用做预算的方法。 6. 2. 1 上溯法 上溯法 适合 于根 据项 目任 务确定 来确 定最 终的 总报 价的情 况。图 15-7 表示了 利用上 溯 法进行预算的步骤。 合同的范围 各项任务 人员所需要 的时间 合同的范围 人力总费用 提成 临时 / 应急费用 实际总费用 利润 总报价 图 15-7:利用上溯法进行项目预算 利用上溯法进行预算,需要注意以下问题: 1)需要完全理解项目的范围,因为该方法是依据项目的内容和范围来着手和定义,确 定范围过大或过小,都会对总报价有很大的影响。如果范围边界存在模糊,可以使用一些约 束条件。 2)项目任务的划分,如果一个项目的任务划分基本正确,那么总报价不会出现太大的 偏差。在进行任务划分以及任务工作量估计时,可以参照以往类似的工作进行。 3)提成和利润,在总报价中,提成和利润占有相当的份额。在美国, GIS 项目中,人 力费用、办公费用和公司利润大约各占三分之一。 6. 2. 2 下溯法 下溯法适用于预算总额已经确定的情况,对各个划分的任务确定其具体费用。在实际工 作中,可以与上溯法相结合,对预算方案进行调整,使结果既能考虑到项目总费用,又能顾 及具体的任务工作量。 6. 2. 3 单价法 单价法是指以项目的单个单元为计价的预算方法,适合于过程比较固定、重复性较大的 项目类型。最典型的使用单价法进行预算的项目是地图数字化,例如要对 500 幅地形图进行 数字化,在考察大多数地形图内容、质量、预期数据量后,根据最终确定的数字化流程以及 精度要求, 可以推算出平均每幅地形图所需要的时间和费用,进而就可以得到总的项目费用。 6. 2. 4 根据项目参与人员的费用做预算的方法 根据项目参与人员的费用来做预算取决于项目使用的人员类型,通常该方法在使用高级 技术人员的情况下使用。该方法注重每个人参加项目的时间,而无需对项目的任务加以严格 定义。 如同进度安排一样,进行项目预算时,为了能够应付项目过程中出现的各种问题,保持 一定的“弹性”是必需的。 7.人员管理 7. 1 地理信息系统应用项目中的人员 在地理信息系统应用项目的组织和建设过程中,不论是由应用部门独立开发还是和由专 门的独立软件开发商进行开发,其中涉及的人员按照角色,可以分为以下几类: 7. 1. 1 项目管理人员 项目管理人员负责整个项目,又称为项目经理。在项目实施之前,项目管理人员参与制 订工作计划;在项目开发过程中,要监督和管理项目的进度与开销。当进度落后或者开销超 出预算时,项目管理人员要找出其中的原因,并提出解决的方案。 在具体实践中,根据项目的规模以及开发组织方式(合作开发还是单独开发),可以设 一个或多个项目管理人员,具体分管不同的方面。项目管理人员应该对项目目的以及相关技 术相当熟悉,并且具有一定的管理能力。在合作进行的项目开发中,一般由双方各出一人担 任项目管理人员,以进行协调工作。 7. 1. 2 系统开发人员 系统开发人员在应用项目的开发过程中,所占比例应该是最大的。按照所进行开发活动, 可以分为系统分析员、设计员、编程实现人员、测试人员以及系统维护人员。同时可以按照 项目的具体技术内容,划分为几个技术专题,每个专题对应一个或多个开发人员。 一般而言,系统分析员、设计员、编程实现人员不应该重叠,但是在实际过程中,由于 人力资源不足,更由于没有很好地实施软件工程,分析设计文档不够完善,造成交流困难, 一般都按照技术专题对人员进行分组,每一组完成该专题的需求分析,设计和实现工作。在 项目规模较小时,可以采用这种人员组织方式,以提高灵活性。 7. 1. 3 数据录入和处理人员 数据在 GIS 应用项目中占有非常重要的位置。一个 GIS 项目,往往需要大量的数据, 所以在进行软件开发的同时,需要组织数据的录入和处理。数据录入和处理没有特殊的技术 要求,一般的工作人员,经过简单的培训即可胜任该工作。在项目进行中,需要考虑的因素 有: 1)数据录入和处理是一件相当单调而且令人厌烦的工作,需要工作人员认真负责,同 时还要采取适当的激励手段以保证工作顺利进行; 2)在数据录入和处理过程中,需要专门的技术人员进行质量检查,避免数据精度不能 满足最终项目的要求; 3)如果待开发软件包括了数据录入功能,如果等待软件完成后再进行数据录入,可能 会造成工期延误,因此可以考虑先采用其它软件进行数据录入和处理,然后再进行数据转换。 7. 1. 4 开发支持人员 开发支持人员保证整个开发过程的顺利进行,其工作包括开发工具的维护,网络管理等 等,如果项目规模较大,需要配置管理人员保证协作开发不至于引起混乱。 7. 1. 5 领域专家 由于许多 GIS 应用项目对应于专业的要求,所以需要领域专家参与开发过程,以便于 将他们的理论、经验在计算机系统中加以实现。 7. 1. 6 用户 用户不直接参与开发过程,但是他们是系统的最终使用者。在开发系统之前,需要从用 户那里获得需求;在开发过程中,完成的原型系统一般需要由用户进行评估。 7. 1. 7 其它支持人员 包括不直接参加项目的支持人员,如财务人员,文档管理人员等等,他们对于项目的正 常运行起着重要的作用。 7. 2 对人员需求的了解——进行管理的基础 在项目过程中,需要对参加项目的各类人员进行妥善的安排,对于人的管理,首先要求 项目管理人员了解各个执行人员的性格特性,从而了解其需求 * ,找到调动其积极性的因素, 并积极满足其需求。在信息技术领域,员工的积极性直接影响了工作效率和质量,因而,在 GIS项目组织管理中,调动员工积极性对于项目管理人员尤为重要。 一般认为,与工作有关的需求因素包括: 1)工资或奖金的多少; 2)在机构内的职位和责任范围; 3)人际关系; 4)工作的挑战性; 5)个人的被承认程度; 6)所拥有的自由度; 7)享受各种待遇的程度,如医疗保险、假期等等; 8)物质方面,包括办公条件等等。 不同类型的人对不同需求的要求程度也有所差异,如工作型的人员期望得到较好的工 资、待遇、职称、办公条件,而事业型的人员则更看重工作的挑战性、责任范围、个人的发 展等方面的内容。此外,人员的性格也决定了相互之间的合作模式以及他们在组织中最合适 的位置。不同性格的人可以合理地安排在一起,形成一种和谐的工作环境,保证项目的顺利 完成。 在工作中,通常高的收入是工作人员最基本的需求,换言之,提高工资报酬是管理人员 采取的主要激励手段。 但是, 经济学家认为,劳动力的供给是 “向后拐弯”的曲线(图 15-8)。 * 马斯洛的需要五层次包括:生理的需要,安全的需要,爱和归属的需要,获得尊重的需要,自我实现的 需要。人员在工作中的需求可以归纳到这五个层次中。 图 15-8:劳动力供给曲线 造成种 现象 的主 要原 因是 , 当 雇员 的工 资达到 一定 水平之 后 , 随 着收入 的增 长, 追求 更 多的闲 暇, 使工 作时 间减 少。 对 于 项 目 管 理 人 员 , 了解劳 动力 供给 的这 种特 性, 可 以 采 取 更 加灵活 的刺 激手 段, 例如 对于开 发人 员, 一个 具有 挑战性 的工 作往 往能 够激 发其工 作热 情 。 7. 3 人员的组织管理 项目管 理者 除了 根据 每个 工作人 员的 具体 情况 确定 其分工 , 采用 以下 管理 手段 有助于 提 高组织的生产效率: 1)工作的内容 保证分 配适 当的 任务 给雇 员, 其分 配依 据包括 其技 术与性 格的 特点 。 此 外 , 一般要 给出 较多的工作量,使得每个工作人员总是有足够的工作做。 2)工作的安排 根据项目所需要的时间,每隔一定时间对整个任务进行安排。 3)交流 与技术 人员 的交 流, 可以 使管理 人员 了解 项目 的具 体进度 及遇 到的 技术 难点 , 还 可 以 使 技术人员把握整个项目的技术、时间、质量等具体的要求。 4)项目背景和发展要求的回顾 给技术 人员 较为 全面 的项 目介绍 , 包 括背 景、 参与 的团体 、 进 度安 排等 , 容 易使技 术人 员了解其工作在整个项目中具体的位置,增强其成就感。 5)层次 在关键的岗位使用优秀的人才。 6)新技术 关注新技术的发展,注重技术革新,通过组织技术培训保证技术人员掌握新技术。 7)会议 适当地 组织 不同 层次 、 规 模 的会议 , 在会 议进 行之 前 , 组织者 要明 确会 议的 主题 和目的 , 使参与人员有所准备。 8)交流手段 采用电子邮件是较好的信息交流手段,它可以作为开发的历史档案加以保存。 在信息 技术的 开发和 应用 中,人 员的管 理是 企业管 理中最 重要的 一个 环节, 对于 GIS 应用项目,由于涉及各个领域的技术人员,更需要有效的人员组织和管理。 8.开发和数据管理 在建立地理信息系统应用的过程中,软件开发和数据处理是最为繁重的两个技术任务, 对这两个部分的管理的好坏直接影响到整个项目的成败。 8. 1 软件开发管理 尽管在软件工程方面已经有许多的技术和方法,如结构化方法,面向对象的方法等等, 在开发过程中采用这些方法以提高效率,但是开发过程的管理始终是决定一个软件项目成败 的重要因素。对于开发管理,并没有“万能”的办法可以适用于所有的软件开发过程,但是 在管理中遵循以下原则可以更好地确保软件产品质量和开发效率[B.W.Boehm] ,这些原则同 样也适用于 GIS 平台软件的开发。 1)用分阶段的生命周期计划严格管理 在整个软件生命周期中,要完成许多性质各异的工作。该原则意味着把软件生命周期分 成若干个阶段,并制定严格计划对软件开发和维护进行管理。通常以下六类计划是应该制定 并严格执行的,即项目概要计划、里程碑计划、项目控制计划、产品控制计划、验证计划和 运行维护计划。 2)坚持进行阶段评审 软件的质量保证不能等到编码结束之后再进行,这是因为,第一,大部分错误是在编码 之前造成的;第二,错误发现越晚,所需要代价越高。因此,需要在每个阶段都进行严格评 审,以便尽早发现软件开发过程中的错误。 3)实行严格的产品控制 在开发过程中,用户的需求难免发生变化,而为了满足其变化的需求往往要付出较高的 代价,这就需要进行严格的产品控制,通常所采用的技术就是配置管理。 4)采用现代程序设计技术 实践表明, 采用先进的程序设计技术既可以提高开发效率, 又可以提高软件的可维护性。 这些技术包括结构化分析、设计、编程技术以及面向对象的分析、设计、编程技术等。 5)结果应能够清楚地审查 软件产品是思维的产物,这决定了工作过程难于评价和管理,难以准确度量。为了提高 开发过程的可见性,以便进行管理,应该根据总目标和进度,规定开发组织的责任和产品标 准。 6)开发小组的人员应该少而精 软件开发小组的组成人员素质应该好,而人数不宜过多。素质高的人员开发效率比素质 低的人员的开发效率可能高几倍到几十倍,而且错误更少。而小组人数的增多会造成交流的 困难。 7)承认不断改进软件工程实践的必要性 由于技术在不断进步,应该主动采纳新技术,而且要不断总结经验,以不断改进工程实 践 * 。针对一个项目,遵循前六点就可以保证项目的成功,该原则使软件组织能够持续发展。 * 这也正是CMM 第五级所强调的。 8. 2 数据管理 在一个 GIS 应用 项目 中, 通常需 要输 入和 处理 大量 的数据 ,其 中主 要是 空间 数据, 如 果没有采取合适的数据管理,那么可能因为以下原因造成项目的混乱甚至失败: 1)数据质量不能达到项目要求; 2)数据没有完全输入或处理,造成项目延期; 3)数据重复录入或处理,造成人员和时间的浪费; 4)进行数据处理和模型运算时,没有及时采用最新的数据。 为了避 免出 现上 述的 问题 ,必须 对数 据的 录入 和处 理过程 和数 据质 量进 行严 格的控 制 。 通常 GIS 应用项目 的空 间 数据来 源包 括: GPS 数 据 ,摄影 测量 数据 ,测 量数 据,卫 星遥 感 数据, 已有 非数 字地 图。 不同的 来源 ,其 处理 和质 量控制 原则 也有 所差 别。 对于 GPS 数据 和测量 数据 , 只 需要 进行 简单的 数据 规范 化 ( 如格 式转换 , 拓 扑关 系建 立等 等) 处 理 , 就 可 以在 GIS 中使用 ,其 精度 由 GPS 或 测 量 设 备 决定, 在数据 处理 过程 中不 会带 来新的 误差 。 摄影测 量数 据和 卫星 遥感 数据通 常需 要进 行一 系列 纠正操 作, 然后 进行 自动 或半自 动解 译 , 以提取 专题 信息 ,最 后通 常是转 换为 多边 形数 据, 输出到 GIS 应用 中, 其误 差来源 包括 纠 正 ( 包 括 辐 射 纠 正 和 结 合 纠正) 以及 分类 过程 中的 误分。 纸质 地图 的录 入, 可以采 取手 扶跟 踪数字 化和 扫描 矢量 化两 种方式 , 其 误差 来自 于数 字化过 程, 并且 与进 行数 字化人 员的 工作 态度有密切的关系,此外数字化数据往往现势性较差。 数据输 入和 处理 的进 度控 制可以 采用 普通 的里 程碑 方法或 甘特 图法 , 如果 工作 区范围 较 大,并 且每 一数 据处 理单 元只覆 盖工 作区 的一 部分 ,可以 采用图 15-9 所示的 方法, 以表 示 进度,其优点是更加直观,不容易遗漏数据。 图 15-9:一种直观的数据输入进度管理方法示例 (图中每一矩形框内的时间表示该数据应该完成的时间, 深灰色矩形表示已经完成,而浅灰色矩形表示数据录入和处理正在进行) 如果项 目中 数据 量大 , 并 且需要 多个 数据 文件 以存 储数据 , 那 么需 要在 工作 进行之 初就 定义文件的命名规则,以通过文件名表达其数据内容,避免造成管理上的混乱 * 。如用文件 * 采用地理信息系统软件工程技术一章中描述的数据配置管理方法可以更好的避免数据管理混乱。 名SO01DG 表示第一次数字化的土壤图( SO: Soil,土壤;01 :第一次;DG:数字化)。通 过文件名表达的信息可以有专题、已进行的处理、时间、处理人员、数据区域范围等等,但 是太长的文件名同样会造成记忆的困难。 除了定义文件命名规则外,其它描述信息,包括数据来源、地物的数值范围、地图投影、 精度、数据的依赖关系等元数据可以建立数据字典。可以对数据字典进行检索,以掌握数据 的进度。 9.项目控制与评估 在 GIS 应用项目进行中,控制活动要贯穿于整个项目的始终,才不至于在项目完成后 出现严重的质量以及时间问题。而在项目的每一个阶段、或者整个完成之后,进行事后分析 和评估可以更好地了解项目进展中的问题,对项目参与人员进行评定,为下一阶段或者以后 类似项目组织管理作为参考依据。从一定意义上来讲, 进行评估是实施项目控制的有效途径。 通常,进行事后分析和评估的对象包括: 1)程序:数量和质量; 2)数据:数量和质量; 3)参与人员:工作时间和效率; 4)资金:使用情况和使用效率; 5)设备:占用情况和效率。 在对上述因素进行分析和评估时,要尽可能使用定量的方法,一方面数量能更准确地说 明项目进展和存在的问题;另一方面,采用数量也便于进行横向和纵向的对比。横向对比是 指项目中各个小组,甚至不同人员的对比,纵向对比是指项目的不同阶段或不同项目之间的 对比。 分析评估的结果可以以表格、统计图的形式直观的表现(表 15-6,图 15-10),项目管 理人员可以根据结果评估工作进展,发现问题,并在下一步的工作中进行改正。 表 15-6:XX 项目第一阶段(1999 年 1 月-1999 年 10 月)工作分析结果 项目 数值 程序 代码总行数 错误数目 错误比率 数据 录入总数据量 抽样平均偏移误差 遥感分类后数据总量 抽样分类精度 人员 人员总工作时间 资金 总使用资金 78532 130 1.65处/千行 78兆 0.12毫米 290兆 83% 140人月 8.2万元 表 15-6 列出了从总量上对项目中各个要素分析的结果,可以作为计算项目阶段成本、 效率的依据;而图 15-10 更好的说明了项目的进展状况,可以使管理者方便地发现项目进展 顺利和不顺利的时间段,并进而发现其原因,作为下一阶段工作管理的依据。而整个项目的 分析图表可以被复用于下一个类似的项目,进行成本——效益分析和进度安排。 图 15-10:通过不同指标反映项目的进展状况 10.软件研制和开发的质量管理—— 对于 GIS 软件开发组织的指导 由于计 算机 技术 的发 展以 及用户 需求 的增 长 , GIS 软件的 研制 与开 发 ( R&D, Research and Development)也越来 越多, 这意 味着 竞争 也愈 加激烈 。对 于 GIS 软 件 开 发组织 ,在 市 场上取 得成 功的 因素 包括 : 技 术 的 先 进 性 、 功 能 的 实用性 和可 靠性 、 系 统操 作的便 利性 、 版 本的连 续性 以及 技术 支持 维护等 等。 为了 达到 这些 目的, 唯一 的途 径就 是采 用合适 的质 量管 理与控制。 10. 1 ISO-9000 系列标准 质量管 理的 目的 是为 了生 产高质 量的 产品 , 它 不是 通过检 验产 品的 质量 , 而 是把质 量建 立在生 产过 程之 中来 达到 。近年 来, 国际 上影 响最 为深远 的质 量管 理标 准是 ISO9000 系列 标准 。 ISO9000 最初 主要 针对 制 造 行 业 , 现 在已 经扩展 到 硬件、 软件 甚至 服务领 域。 ISO9000 强调控 制 、 可 审 查 性 、 检 验 与核实 以及 过程 的改 进 。 其基本 要求 是: “说 你做 的 (Say what you do)” , “做你说的 (Do what you say)” ,并“证明你已做的 (Demostrate what you have done)” 。 ISO-9000 系列标准包括: 1) ISO-9000 质量管理和质量保证标准——选择和使用的导则; 2) ISO-9001 质量体系——设计 /开发,生产,安装和服务中的质量保证模式; 3) ISO-9002 质量体系——生产和安装中的质量保证模式; 4) ISO-9003 质量体系——最终检验和测试中的质量保证模式; 5) ISO-9004 质量管理和质量体系要素——导则。 ISO-9000 原本为 了制 造业 而规定 , 不 能直 接应 用于 软件行 业, 后来 追加 了 9000-3 标准, 成为“使 ISO-9001 适用于软件开发、供应和维护的指南” 。 ISO-9000-3 的核心思想 是 “将质 量制 作入 产品 之中 ” ,也就 是说 ,软 件的 质量 提高不 能 依赖于完成后的测试,而取决于整个软件生存期所有的活动。 ISO-9000-3 的要点如下: 1) ISO-9000-3 标准不 适用 于面向 多数 用户 销售 的程 序包软 件, 仅适 合于 依照 合同进 行 的单独订货开发软件,它也是用户企业的系统部门在建立质量保证体系时的指南; 2)ISO-9000-3 标准对供需双方领导的责任都做了明确的规定,并没有单纯地把义务全 部加在供方; 3)在包括合同在内的全部工序中进行审查,并彻底文档化。具体来说,就是需方和供 方合作审查,找出含混不清的问题,并记录在文件中; 4)ISO-9000-3 叙述了供方和需方如何合作进行有组织的质量保证活动才能制作完美的 软件,强调质量保证体系贯穿于整个开发过程,强调防患于未然而不是事后纠正; 6)供方应实施内部质量审核制度,要求供方为了质量管理而整顿其组织机构,建立监 督质量体系的机制; 7)供方应对每项合同进行审查。 10. 2 软件过程改进的 CMM 模型 由于 ISO-9000 系列标准并不针对于软件企业,到九十年代初, CMU 的 SEI(软件工程 研究所) 提出了软件的能力成熟度模型(CMM-Capability Maturity Model for Software) 。 与 ISO9000 相比, CMM 只关注软件,明确强调持续的过程改进,而 ISO9000 只是解决 质量体系的最小保证。 CMM模型较为全面地描述和分析软件过程 * 能力的发展程度,建立了描述一个组织的软 件过程成熟程度的分级标准。利用该标准,软件组织可以评估自己当前的过程成熟程度,并 通过提出更严格的软件质量标准和过程改进,来选择自己的改进策略,以达到更高一级的成 熟程度。CMM 模型共有五个成熟度级别,其特征为: 1)初始级(Initial) 软件过程杂乱无章,有时甚至混乱,几乎没有明确定义的步骤,成功完全依赖于个人努 力和英雄式的核心人物。 2)可重复级(Repeatable) 建立了基本的项目管理过程来跟踪成本、进度和机能,有必要的过程准则来重复以前在 同类项目的成功。 3)定义级(Defined) 管理和工程的软件过程已经文档化、标准化,并综合成为整个软件开发组织的标准软件 过程,所有的项目都采用根据实际情况修改后得到的标准软件过程来开发和维护软件。 4)管理级(Managed) 制订了软件过程和产品质量的详细度量标准。软件过程和产品的质量都被开发组织的成 员所理解和掌握。 5)持续优化级(Optimizing) 加强了定量分析,通过来自过程质量反馈和来自新观念、新技术的反馈使过程能够不断 持续地改进。 CMM 定义了每个成熟度级别的关键过程范围(图 15-11),一个软件组织只有满足该范 围内的每个目标,才能被认为达到该成熟度级,这实际上也是软件组织达到更高一级成熟度 的指导。 * 软件过程是人们用于开发和维护软件及其相关产品的一系列活动、方法、实践和改造。软件的开发有两 种截然不同的方式:“面向过程的(Process Oriented )”和“面向责任的(Commitment Oriented )”,前者强 调过程的规范和持续优化,后者更强调个人的能力。目前许多软件企业都开始注重软件过程。 图 15-11: CMM 模型中的五个成熟度级别,其关键过程范围 [CMU SEI] CMM 建立 了一 个可 用的 标 准描述 , 在 签 定 软 件 项 目 合同时 , 可 以 参 考 这 些 标 准进行 风 险评估,而软件企业可以利用 CMM 框架来改进其开发和维护过程。 尽管 CMM 列出 了每 个成 熟度级 别的 特征 和关 键过 程, 但是 并没 有回 答如 何做 才能达 到 高一级 的成 熟度 级的 问题 , 没有提 出特 定的 软件 技术 , 也没有 涉及 如何 具体 的进 行人员 管理 , 这些都需要应用 CMM 的组织在实践过程中,根据其具体情况加以解决。 工欲善其事,必先利其器。 孔子 第十六章 地理信息系统软件工程技术 导读:本章介绍了软件工程的基本概念,软件开发活动,过程模型以及两种重要的 开发方法:结构化方法和面向对象的方法。在GIS开发过程中应用软件工程技术, 可以提高软件开发效率和质量。本章讲述了软件工程技术在GIS系统开发中的几个 应用方面: GIS软件构件和构架 需求分析 数据管理设计 用户界面设计 设计模式在GIS软件开发中的应用 应用配置管理来实现空间过程支持 这些方面涉及了GIS开发过程中不同的阶段以及不同的层次,有些方法之间是互斥 的,如UML和Code方法,但是软件工程技术最重要的是实用,开发者可以根据具 体的情况选用不同的技术。 1.软件工程简介 1. 1 基本概念 计算机软件工程是一类求解的工程。它应用计算机科学、数学及管理科学等原理,借鉴 传统工程的原则、方法,创建软件以达到提高质量,降低成本的目的。其中,计算机科学、 数学应用于构造模型与算法,工程科学用于制定规范、设计范型,评估成本及确定权衡,管 理科学用于计划、资源、质量、成本等管理。从学科角度来看,软件工程是一门指导计算机 软件开发和维护的工程学科。 软件工程的提出,是为了解决 60 年代出现的软件危机,当时在大型软件开发中存在着 价格高,开发不容易控制,软件开发工作量估计困难,软件质量低,项目失败率高等许多问 题,给软件行业带来了巨大的冲击。软件工程的研究,提出了一系列理论、原则、方法以及 工具,试图解决软件危机。 和其它工程一样,软件工程有其目标、活动和原则,其框架可以概括为图 16-1 所表示 的内容。 图 16-1:软件工程框架 [王立福 ] 软件工 程的 目标可 以概 括 为“生 产具 有正确 性、 可 用性以 及开 销合宜 的产 品” ,其活 动 包括需 求、 设 计 、 实 现、 确认以 及支 持等 活动, 围 绕工程 设计、 支持 以及 管 理 , 有 以 下 的 四 条基本原则: 1)选取 适宜 的开 发模型 , 可以认 识需 求易变 性, 并 加以控 制, 以保证 软件 产 品满足 用 户的需求; 2)采用 合适 的设 计方法 , 通常要 考虑 实现软 件的 模 块化、 抽象 与信息 隐蔽 、 局部化 、 一致性以及适应性等特征; 3)提供 高质 量的 工程支 持 ,在软 件工 程中, 软件 工 具与环 境对 软件过 程的 支 持颇为 重 要; 4)重视 开发 过程 的管理 , 软件工 程的 管理, 直接 影 响可用 资源 的有效 利用 、 生产满 足 目标的 软件 产品 , 提 高软 件组织 的生 产能 力等 问题 。 只 有当 软件 过程予 以有 效管理 时 , 才 能 实现有效的软件工程。 1. 2 软件工程活动 软 件 工 程 活 动 包 括 需求、 设 计 、 实现、 确认 及支 持等 , 它 们对 应于 软件 开发活 动 的 不 同 阶段 , 一 般来 说, 软件 开 发都要 经历 从分 析设 计到 实现确 认的 过程 。 在 每个 阶段按 照相 应的 规范进行工作,并得到该阶段的成果,是保证整个开发活动成功的关键。 1. 2. 1 需求分析 需求分 析阶 段处 于软 件开 发的前 期, 其基 本活 动是 准确定 义未 来系 统的 目标 , 确 定 为 了 满足用 户的 需求 必须 做什 么。 需求 分析 又划分 为两 个阶段 , 即 需 求获取 和需 求规约 , 前 者 是 用自然语言清 楚地描述用 户的要求,而 需求规约的 目的是消除获 取需求的二 义性和不一 致 性。 在软件 生命 周期 中 , 一 个 错误发 现得 越晚 , 修 复 错 误的费 用也 越高 , 所 以 , 高质量 的需 求工程 是软 件项 目得 以正 确、 高效 完成 的前提 。 对 于系统 分析 人员 , 建 立需 求面临 着以 下三 个方面的困难: 1)问题空间的 理解 , 系 统 开发人 员通 常是 计算机 专 业人员 ,难 以深 入理解 各 种业务 系 统所要解决的问题空间; 2)人与人之间的通信,对于系统分析人员而言,通信主要包括同用户的通信以及同事 之间的通信,由于自然语言的二义性,会给准确刻画需求造成障碍; 3)需求的不断变化,造成需求变化的原因很多,包括技术,用户方,市场等等,作为 分析人员,必须采用一些策略以适应变化。 面向对象的分析方法被认为是解决上述困难较好的技术,但是完整、准确的刻划问题空 间始终是分析人员所面临的挑战。 1. 2. 2 系统设计 一般来说,需求分析阶段的主要任务是确定系统“做什么”,而设计阶段则要解决“怎 么做”的问题。通常 * 设计阶段又划分为总体设计和详细设计,总体设计确定系统的总体结 构框架;而详细设计要具体地描述如何具体地实现系统,通常可以依据详细设计的结果进行 编码。详细设计包括:详细的算法;数据表示和数据结构;实施的功能和使用数据之间的关 系。详细设计过程中,采用了一些工具,以便对数据、算法等进行描述,包括流程图, PAD(Problem Analysis Diagram),盒图(N-S 图) ,伪码等等。 1. 2. 3 实现阶段 在软件实现阶段,要将设计的结果变换成程序设计语言编写的程序。在实现阶段,首先 要确定程序设计语言,其影响因素包括:开发人员对语言的熟悉程度,语言的可移植性,编 译程序的效率,编译工具的支持等等。目前, C++语言是普遍被采用的构造系统软件的编程 语言,而 Java 则更多地应用于编写网络程序。 无论采用哪一种编程语言,都要求编写高质量的源程序代码,程序质量通常包含正确性、 可读性、可移植性、程序效率等指标。考虑到系统的维护和演化,提高源程序的可读性是实 现阶段的一个重要目标,其途径包括添加注释,规范书写格式,确定标识符命名原则 * ,采 用结构化的程序设计(不用或减少使用goto语句)等等。 1. 2. 4 确认活动 尽管确认活动贯穿于软件开发活动的始终,但是系统完成后的软件测试是主要的确认活 动。软件测试是指按照特定规程,发现软件错误的过程。软件测试的技术大体上可以分为两 类,即白盒测试技术和黑盒测试技术,前者依据的是程序逻辑结构,后者依据的是软件行为 描述。根据测试的步骤,测试活动又可以划分为单元测试,集成测试,确认测试和系统测试, 其中确认测试是为了检验软件的功能和性能是否与用户需求一致,而系统测试主要是测试软 件同硬件、其它支持软件、数据等结合在一起,在实际的运行情况下,同用户需求的匹配程 度。 * 这里实际上是指结构化的设计,在面向对象方法学中,各个阶段的分界已经被模糊化了。 * 微软所采用的匈牙利命名法是一个较好的对标识符进行命名的方法。 1. 2. 5 软件维护 当 软 件 开 发 完 成 并 交 付 用 户 使 用后,就进 入运 行 /维 护阶段 , 在 运 行 /维护 阶段 仍需要 对 软件进行修改,称为软件维护,软件维护活动可以分为以下几类: 1)改正性维护 , 其 目的是 为了纠 正运 行阶 段发现 的 软件错 误, 性能 上的缺 陷 以及排 除 实施中的误用。 2)适应性维护 , 随 着计算 机的发 展, 软件 的外部 环 境或者 数据 环境 发生变 化 ,为了 使 之适应这种变化而对软件的修改称为适应性维护。 3)完善性维护 , 在 使用过 程中, 用户 往往 会对软 件 提出新 的功 能和 性能需 求 ,为了 满 足这些需求,需要修改或再开发软件,称为完善性维护。 4)预防性维护 , 预 防性维 护的目 的是 为了 提高软 件 的可维 护性 ,可 靠性等 , 为进一 步 的软件维护打下良好的基础。预防性维护一般由开发单位主动进行。 1. 3 结构化方法和面向对象方法 在进行 系统 分析 设计 的过 程中, 逐渐 形成 了一 些系 统化的 方法 , 以 便于 更好 地描述 问题 域及进行系统设计,目前经常采用的两种方法是结构化方法和面向对象的方法。 1. 3. 1 结构化分析和设计 结构化 的方 法基 于模 块化 的思想 , 采 用 “ 自 顶 向 下 , 逐步求 精 ” 的 技 术 对 系 统 进行划 分, 分解和抽象是它的两个基本手段。 结构化 分析 将软 件视 为一 个数据 变换 装置 , 接 受各 种输入 , 通 过变 换产 生输 出。 数 据 流 图( DFD, Data-Flow Diagram) 是一种 描述 数据 变换 的工具 , 是 结 构 化 分 析 普 遍采用 的表 示 手段。 数据 流图 由五 个部 分组成 , 即 : 加工, 数据 流, 数 据 存 储 , 数 据源 和 数据潭 , 其 中数 据流表 示数 据和 数据 的流 向, 而 加 工 是 对 数 据 进 行 处理的 单元 (图 16-2) 。 除 了数据 流图 以 外,还需要数据字典和说明分别对数据流和加工进行描述。 旅行社 预订 机票 准备 机票 订票单 航班 记帐 费用 旅客 记帐文件 航班目录 机票 图 16-2:一个典型的数据流图:飞机订票 结构化 的系 统总 体设 计主 要是确 定模 块结 构图 , 以 描述功 能模 块之 间的 关系 , 一 些 主 要 的表示形式 有:层次 图, HIPO(层次 +输入 /处理 /输 出)图,结 构图等等 。结 构化的设计 定 义了一些原则和方法,可以将数据流图“映射”成为模块结构图。 1. 3. 2 面向对象的分析和设计 面向对 象的 方法 学认 为, 客观世 界是 由许 多各 种各 样的类 组成 的, 每种 对象 都有各 自的 内部状 态和 运动 规律 , 对 象之间 的作 用和 联系 就构 成了各 种不 同的 系统 。 面 向对象 方法 学所 追求的 是使 解决 问题 的方 法空间 与客 观世 界的 问题 空间结 构达 成一 致 。 由 于 面 向对象 的技 术 在理解 问题空 间、控 制需 求变化 、消除 从分析 设计 到编码 的“鸿 沟” 、 支持软 件复用 等各个 方面优于其它方法,使之称为目前软件开发的主流方法。 目前已 经提 出了 多种 不同 的面向 对象 的分 析、 设计 方法, 如 Cord-Yourdon 方法 , Booch 方法, OMT 方法 , Jacobson 的 use case 驱 动 方 法 等 等,这 些方 法在 侧重 点、 符号表 示和 实 施策略 上有 所不 同, 但是 其基本 的概 念是 一致 的, 这些概 念有 : 对 象, 类, 属性, 服务, 消 息,继承,封装等等。 近年来 , 综 合 Booch方法 、 OMT方法 以及 use case的 UML(Unified modeling language,统 一建模语言 )逐渐成为主要的面向对象方法。图 16-3 给出了用 UML表达几何体的例子 * 。 图 16-3:用 UML 表达的线几何体类以及和其它类的关系( OpenGIS Consortium)。 * 图的具体含义请参阅 ULM和 OpenGIS的相关规范。 1. 4 开发过程模型 软件开 发模 型是 软件 开发 全部过 程、 活动 和任 务的 结构框 架。 软件 开发 模型 能够清 晰 、 直观的 表达 软件 开发 过程 , 明 确 规 定 要 完 成 的 主 要 活动和 任务 , 可 以作 为软 件项目 工作 的基 础。 随着软件工程了实践,相继提出了一系列开发模型,如下: 1. 4. 1 瀑布模型 在瀑布 模型 中, 将各 项活 动 规定为 依照 固定 顺序 连接 的若干 阶段 工作 , 形如 瀑布流 水 (图 16-4) ,瀑布模型的特征是:每一阶段接受上一阶段的工作结果作为输入;其工作输出传 入 下一阶 段; 每一 阶段 工作 都要进 行评 审, 得到 确认 后, 才 能 继 续 下 阶 段 工 作 。 瀑布 模型 较好 地支持 结构 化软 件开 发 , 但 是缺乏 灵活 性 , 无 法 通 过 软 件开发 活动 澄清 本来 不够 确切的 需求 。 系统需求 软件需求 需求分析 设计 编码 测试 运行 图 16-4:瀑布模型 1. 4. 2 演化模型 演化模 型主 要针 对事 先不 能完整 定义 需求 的软 件开 发。 用 户 可 以 先 给 出 核 心 需求, 当开 发人员将核心需求实现后,用户提出反馈意见,以支持系统的最终设计和实现。 1. 4. 3 螺旋模型 螺旋模 型是 在瀑 布模 型以 及演化 模型 的基 础上 , 加 入风险 分析 所建 立的 模型 。 在 螺 旋 模 型每一次演化的过程中,都经历以下四个方面的活动: 1)制定计划——确定软件目标,选定实施方案,弄清项目开发的限制条件。 2)风险分析——分析所选方案,考虑如何识别和消除风险。 3)实施工程——实施软件开发。 4)客户评估——评价开发工作,提出修正建议。 每一次 演化 都开 发出 更为 完善的 一个 新的 软件 版本 , 形 成 了 螺 旋 模 型 的 一圈。 螺旋模 型 借助于 原型 , 获 取用 户需 求, 进 行 软 件 开 发 的 风 险 分析, 对于 大型 软件 的开 发, 是 颇 为 实 际 的方法。 1. 4. 4 喷泉模型 喷泉模 型体 现了 软件 开发 过程中 所固 有的 迭代 和无 间隙的 特征 ( 图 16-5) 。 喷 泉模型 表 明了软 件刻 画活 动需 要多 次重复 。 例 如, 在编 码之 前, 再 次 进 行 分 析 和 设 计 , 并添 加有 关功 能, 使 系 统 得 以 演 化 。 同 时 , 该 模型 还表 明活 动之 间没有 明显 的间 隙, 例如 在分析 和设 计之 间没有明确的界限。 在面向 对象 技术 中 , 由 于 对象概 念的 引入 , 使分 析、 设计 、 实 现之 间的 表达 连 贯而一 致, 所以,喷泉模型主要用于支持面向对象开发过程。 演化 维护 确认 实现 设计 分析 图 16-5:喷泉模型 目前, 随着 面向 对象 技术 的发展 和 UML 建模语 言 的成熟 ,统 一软 件开 发过 程 (USDP, Unified Software Development Process)被提 出以 指导 软件开 发, 它是 一个 用例 ( use case)驱 动的 、 体 系结 构为中 心的 、 增 量迭 代的 开发过 程模 型, 适用 于利 用面向 对象 技术进 行软 件 开 发。 2. GIS 领域的体系结构和构件 按照应 用目 的, 地理 信息 系统可 以分 为区 域地 理信 息系统 、 专 题地 理信 息系 统以及 地理 信息系统 工具, 它们 共同 组成了 GIS 领域 ( Domain) 。所谓 领域, 是指共 享 某种功能 性 (Functionality)的系统或应 用程序 的集 合 , 换言 之 , 领域表 现了 一组 应用 系统 共性的 方面 。 对 于地理 信息 系统 而言 , 其 共享的 功能 就是 对空 间数 据输入 、 管 理、 分析 和表 现, 而 这 恰 好 是 地理信息系统工具所提供的功能(图 16-6) 。 操作系统 地理信息系 统工 具 区域 GIS 专题 GIS 领域 应用系统 具体,专用 抽象,通用 图 16-6: GIS 领域 与 具 体 应 用 领 域 相 对应, 对 于 领域, 可以 实施 领域工 程, 得到 领域 模型, 并建 立 领 域 特 定的软 件体 系结 构( DSSA, Domain-Specific Software Architecture) 。 DSSA 是 能 够适应 领域 中多个 系统 的需 求的 一个 高层次 的设 计, 在开 发具 体应用 系统 时, 可以 利 用 DSSA 将领 域 构件( Component)连接和组织起来,以支持软件复用,提高软件开发的效率和质量。 对于地 理信 息系 统, 实施 领域工 程, 得 到 DSSA, 不仅可 以指 导具 体应 用系 统的开 发 , 而且 DSSA 可以直接作为地理信息系统工具的软件体系结构。 地理信 息系 统的 核心 功能 包括空 间数 据的 输入 、 管 理、 分 析 以 及 表 现 , 并 且这 些功能 形 成了一 个比 较完 全的 数据 处理流 程, 此外 考虑 到与 遥感以 及全 球定 位系 统的 结合, 形成 如下 的系统 结构 (图 16-7) 。 该 视图更 多地 体现 了地 理信 息系统 的业 务逻 辑, 为了 适用于 具体 的 应用系 统, 该结 构可 以被 特化— —类 似于 面向 对象 中, 从 父 类 派 生 一 个 子 类 ——形 成更 加具 体的体系结构。 依赖 于 DSSA, 可 以将构 件组装 起来 , 形 成 具 体 的 应用系 统 , 基 于 构 件 的 技 术已经 成为 软件开 发技 术的 主流 , 它 从面向 对象 技术 发展 而来 , 是 开发 高效 、 低 成本 程 序的重 要实 现途 径。 为了能 够通 过组 装以 构造 系统, 构件 必须 能够 互相 合作, 即具 有互 操作 性, 这 是通过 定 义构件 的接 口规 范来 实现 的。 对于 构件 而言 , 除 了 互操作 性之 外 , 还要 支持 分布式 的网 络计 算,即 构件的 互操作 可以 是基于 异种平 台的, 其实 现需要 分布计 算平台 ( DCP-Distributed Computing Paltform)的支持。 图 16-7: GIS 领域体系结构:一个工作流视图 目前存 在着 多种 构件 技术 标准, 其 中 OMG(对 象 管理组 织) 的 CORBA( 公共请 求对 象代理 体系 结构 -Common object request broker architecture) 和 Microsoft 的 OLE/COM/DCOM 技术是其中两个主要的、被广泛采用的标准。 COBRA 定 义 了 一 个 带 有 开 放软总 线的 分布 式结 构, 在这一 结构 中, 来自 不同 厂商、 运 行于不 同操 作系 统上 的对 象, 能够 进行 互操 作。 CORBA 对象 的互 相通 信通 过 对象请 求代 理 ( ORB, Object Request Broker)为 中介 ,可 以在 多 种流行 网络 通信 协议 上实 现。接 口描 述 语言( IDL, Interface Description Language) 用 于 描 述对象 接口 ,它 与语 言无 关,使 得所 有 CORBA 对象以一致的方式被描述。 Microsoft 的 DCOM(分 布 式对象 构件 模型 , Distributed Component Object Model)技 术 是对原 有的 COM 技 术 的 扩展, 以支 持在 网络 上不 同计算 机的 对象 之间 的通 信。 COM 定义 了接口 的二 进制 标准 ,包 括接口 交互 、管 理对 象及 其资源 等等 。而 DCOM 通 过增加 网络 协 议的支持 ,使 得对象 可以 通过网络 互操 作。 DCOM 技术很好 的支 持复用 ,位 置独立, 可扩 展等,并且其执行性能较好,目前被基于 Windows 平台的软件开发商所广泛支持。 图 16-8:基于 DCP 的 GIS 体系结构和构件:一个实现视图 [OpenGIS Consortium] 对于 GIS软件开 发 , 构 件 技 术带来 的除 了实 现复 用 、 支持分 布的 互操 作外 , 还 具有以 下 两个方面的优势 * : 1)数 据 是 GIS 中最为 重要 的部分 , 目 前 各 个 软 件 数 据格式 不同 , 不 便 于 共 享 和保护 用 户已有投资,构件技术通过互操作的支持可以实现数据共享; 2)地理 信息 系统 功能的 涵 盖范围 非常 广泛, 包括 图 形操作 、图 像处理 、地 图 制图、 数 据库管 理、 投影 变换 等等 , 它 们 涉 及 不 同 的 专 业 领 域 。 利 用构 件技 术, 可以 将不同 专业 领域 的具体功能实现为构件,组装形成软件系统,避免了需要同时学习多个专业领域的状况。 图 16-8 给出 了一 个 GIS 体 系结构 以及 构件 的概 念模 型,在 该模 型中 ,体 系结 构具有 多 个“插槽 ” ,而 构件是 “可 插入 (Plugable)” 的,这 种 类似于计 算机 主板的 结构 ,通过 DCP 的支持 ,依 照图 16-7 中所 描述的 工作 流结 构, 可以 很容易 的实 现跨 平台 的地 理信息 系统 软 件。 3. GIS 需求分析 3. 1 GIS 需求获取 需求获 取是 软件 开发 活动 的第一 步, 获 得 正 确 的 需 求 描述是 成功 软件 的前 提。 一 般而言 , 用户需 求分 为两 类, 功能 性需求 和非 功能 性需 求, 前者定 义了 系统 做什 么, 包括输 入、 输出 * 关于这点,在地理信息系统标准以及 OpenGIS中还将详细论述。 以及其间的转换;后者定义了系统工作时的特性,如效率、可靠性、安全性、可维护性、可 移植性等等要求。具体的需求获取内容包括: 1)物理环境,物理设备的位置以及其分布的集中程度; 2)接口,与其它软件系统的接口以及对数据格式的要求; 3)用户或人的因素,包括系统用户熟练程度,使用系统需要接受的训练; 4)功能,系统要完成什么,性能如何; 5)文档,需要哪些文档以及其针对的读者; 6)数据,数据格式、数据精度、数据量、接收和发送数据的频率; 7)资源,使用系统需要的设备,开发需要的人力资源、计算机资源、时间表; 8)安全性,对访问信息的控制程度,数据的备份等; 9)质量保证,对系统的可靠性要求,平均系统出错时间,可移植性,可维护性等。 在地理信息系统需求获取过程中,其内容是基本一致的,只是在数据、组织等方面要进 行额外的考虑。 1)数据 数据在一个 GIS 应用系统中,占有举足轻重的位置。进行需求获取时,与数据有关的 因素包括, ( 1. 1)数据的输出样式:包括屏幕显示、Web 发布、出版、工程图等; ( 1. 2)输出数据的内容和要求:输出数据要包括哪些内容,数据的精度,比例尺等; ( 1. 3)数据的分布性:数据是集中管理还是分布管理; ( 1. 4)现有的纸质地图:现有的纸质地图的内容,其比例尺、时效性、是否涉及保密; ( 1. 5)现有的电子数据:数据形式(栅格/ 矢量/ 属性数据库)、数据格式、完整性、 精度、投影方式、比例尺等因素。 ( 1. 6)数据录入:数据量大小,输入设备,包括数字化仪、扫描仪,软件的支持程度, 进行数据录入的人员数目,能否在预定时间内完成数据录入; ( 1. 7)数据购买:数据量以及价格; 2)人员 因为应用地理信息系统一般是针对专业领域的,在进行需求获取时不仅要考虑一般用 户,而且要听取领域专家的意见,将他们的理论、经验模型化,并在系统中完成。 3)组织 现有的组织机构,有关部门的职责,业务流程, GIS 如何在其业务流程中体现以及因为 应用 GIS 所引起的可能的组织机构的变化。 进行需求获取的方式是多种多样的,包括面谈、电话访谈、参观、问卷、获取领域相关 资料等。在地理信息系统开发中,由于 GIS的概念、功能等还没有被用户深入理解并接受, 采用 GIS专题报告可以很好地激励用户提出需求。如果时间和资金允许,开发原型系统也可 以更好地挖掘用户需求 * 。 3. 2 GIS 需求规约 在需求获取阶段,得到了用自然语言描述的用户需求,但是其中存在着不一致性和二义 性,这些问题要通过需求规约解决。目前有许多方法用于支持需求规约,如功能分解方法, * 在软件工程领域,有一句名言,“用户只有看到他不希望的东西,才知道想要什么”,说明了开发原型系 统的重要性。 数据流 方法, 信息模 型方 法(实 体关系 模型) ,面向 对象方 法。每 种方法 都有 相应的 概念体 系、符号表现和工具支持。 需求规 约的 结果 是形 式化 或半形 式化 的, 系统 的需 求报告 ,它 必须 完整 地刻 画问题 域 , 能够适 应需 求变 化, 此外 , 它 必 须 满 足 用 户 、 分 析 人员、 设计 开发 人员 进行 交流的 需要 , 换 言之,需求需求报告中的符号、描述,对于各类相关人员,其意义是一致的。 正如一 再强 调的 , 面 向对 象的分 析方 法很 好地 解决 了问题 空间 理解 、 需 求易 变性、 交流 等方面 的问 题。 将通 用的 面向对 象分 析方 法应 用 于 GIS, 固 然可以 描述 系统 需 求 , 但 是由 于 GIS 更加 关注 于空 间对 象 和空间 模型 , 在 GIS 中要 经 常处理 一些 特定 的空 间对 象类以 及特 定 的空间 关系( 拓扑关 系、 方位关 系、度 量关系 等) , 对基本 的面向 对象方 法进 行特化 扩展, 采用特 定的 符号 来表 示这 些类以 及关 系, 可以 使需 求报告 的表 述更 加简 捷, 便于信 息交 流 。 对 Coad/Yourdon 方法的扩展—— GeoOOA(部分, George K?sters) GeoOOA 区分了基本类以及四个地理类类型,下面是 GeoOOA 的类符号: 图 16-9:基本类和 GeoOOA 类 一些服 务包 括读 写操 作以 及几何 体标 准服 务赋 予了 GeoOOA 类, 如计 算面 积 ,长度 , 关系检测等等。 地理类 形成 层次 化的 一般 ——特 殊关 系 , 栅 格 类 为 区域类 的特 例 , 而 区 域 , 线, 点是 抽 象地理类的特化。 GeoOOA 同时提供了拓扑的整体——部分结构原语,它们只是适用于空间对象,整 体 部分结构又可以分为:覆盖 (Covering),包含 (Containing),分割 (Partition)。 g108g32覆盖: 整体 对象 和部 分对 象属于 相同 的空 间类 , 整 体几何 体被 部分 几何 体的 联合所 覆盖 ; g108g32包含:整体几何体包含部分几何体; g108g32分割: 是一 种包 含结 构, 但是有 两个 特性 , 即 , 整 体几何 体和 部分 几何 体属 于同一 个类 , 并且部分几何体形成对整体的分割。 三种原语的图形表示如下: 1)覆盖 2)包含 3)分割 图 16-10: GeoOOA 中的整体部分关系 举一个 例子 说明 这三 种整 体—— 部分 关系 , 在 一 个 省级行 政区 ( 区 域 类 ) 内 , 有许多 电 视台站 (点 类) , 每 个 电 视 台站有 其覆 盖范 围 ( 区域 类) , 省 又分 为许 多县 级区划 ( 区 域 类 ) , 由于台 站的 覆盖 范围 之间 存在重 合, 并且 一般 而言 ,所有 台站 的覆 盖范 围要 比省的 范围 大 , 所以省 行政 区和 覆盖 范围 形成覆 盖整 体— —部 分关 系, 而省 行政 区与 台站 为包 含整体 —— 部 分关系,省行政区和县行政区是分割整体——部分关系。 采用 GeoOOA,用图形就直接表述了空间关系,减少了需求报告中文本规约的数量。 4.数据管理设计 数据管理部分设计的目的是确定在数据管理系统中存储和检索数据的基本结构,其原则 是要隔离数据管理方案的影响,不管该方案是普通文件、关系数据库、面向对象数据库或者 是其它方式的。 目前,主要有三种主要的数据管理方法,即文件、关系和面向对象。 1)普通文件管理:普通文件管理提供基本的文件处理和分类能力; 2)关系型数据库管理系统( RDBMS): 关系型数据库管理系统建立在关系理论的基础 上,采用多个表来管理数据,每个表的结构遵循一系列“范式”进行规范化,以减少数据冗 余。 3)面向对象的数据库管理系统:面向对象的数据库是一种正在成熟的技术,它通过增 加抽象数据类型和继承特性以及一些用来创建和操作类和对象服务,实现对象的持续存储。 不论在分析阶段采用何种方法,已经实现是采用 OOPL 还是非 OOP,都可以选择上述 任意的一种方案实现数据的管理。 在地理信息系统软件中,需要管理的数据主要包括:空间几何体数据、时间数据,结构 化的非空间属性数据以及非结构化的描述数据。例如,对于地籍管理系统中的地块, g108g32空间几何体数据:地块界点的坐标; g108g32时间数据:地块存在的时段; g108g32非空间属性数据:地块的权属,地价等等; g108g32非结构化的描述数据:描述地块所需要的图像、声音数据等等。 为了实现对这些数据的管理,通常的方案包括: 4. 1 全部采用文件管理 将所有的数据都存放于一个或者多个文件中,包括结构化的属性数据。采用文件管理数 据的优点是灵活,即每个软件厂商可以任意定义自己的文件格式,管理各种数据,这一点在 存储需要加密的数据以及非结构化的、不定长的几何体坐标记录时是有帮助的。文件管理的 缺点也是显而易见的,就是需要由开发者实现属性数据的更新、查询、检索等操作,而这些, 都可以利用关系数据库完成,换言之,利用文件管理增加了属性数据管理的开发量,并且也 不利于数据共享。目前,许多 GIS 软件采用文本格式文件进行数据存储,其目的是为了实 现数据的转入和转出,与其它应用系统交换数据。 4. 2 文件结合关系数据库管理 这是目前大多数 GIS 软件所采用的数据管理方案。考虑到空间数据是非结构化的、不 定长的,而且施加于空间数据的操作需要 GIS 软件实现,这样就可以利用文件存储空间数 据,而借助于已有的关系数据库管理系统(RDBMS )管理属性数据。采用这种管理方式: 1)空间数据:通过文件进行管理; 2)时间数据:是结构化的,可以利用数据库进行管理; 3)非空间属性数据:利用数据库进行管理; 4)非结构化的描述数据:由于描述数据,不论是文本、图像,还是声音、录象,一般 都对应于一个文件,这样可以简单地在关系数据库中记录其文件路径,其优点是关系数据库 数据量 小 , 缺 点是文 件路 径常常 会因 为文 件的 删除 、 移 动操 作而 变得不 可靠 。 如 果关 系数 据 库支持二进制数据块字段,也可以利用它来管理文本、图像甚至声音、录象文件。 由于空间几何体 坐标数据 和属性数据是分 开存储管 理的,需要定义 它们之间 的对应关 系。 通常 的解 决方 案是 在 文件中 , 每 个 地 物 都 有 一 个唯一 标识 码 (地物 ID), 而在关 系数 据表 结构中 , 也 有一 个标 识码 属性, 这样 每条 记录 可以 通过该 标识 码确 定与 对应 地物的 连接 关系 (图 16-11) 。 采用该 管理 方式 的缺 点在 于经常 进行 根据 地 物 ID 的查 找 ( 既包 括从 给定 地地物 查 找 其 对应地 记录, 又包括 根据 给定地 记录检 索相应 的地 物) ,使 查询、 模型 运算等 一些操 作的速 度变慢。 地物 ID 坐标 X1,Y1,X2,Y2 … X1,Y1,X2,Y2 … X1,Y1,X2,Y2 … … ID1 ID2 ID3 … 地物 ID 属性 1 属性值 属性值 属性值 … ID1 ID2 ID3 … 属性 2 属性值 属性值 属性值 … … … … … … (a)通过文件管理空间数据 (b)通过关系数据库管理属性数据 图 16-11:同时使用文件和关系数据库管理 GIS 数据, 其中利用地物 ID 建立记录之间的连接关系 4. 3 全部采用关系数据库管理 在这种 管理 方式 中 , 不 定 长 的空间 几何 体坐 标数 据以 二进制 数据 块的 形式 被关 系数据 库 管理,换言之,坐标数据被集成到 RDBMS 中,形成空间数据库,其结构如图 16-12。 空间 数据库 数据库访问 接口 空间模型 服务 GIS 应用 GIS 应用 GIS 应用 RDB M S GI S 空间数据访 问接口 图 16-12:集成化的 GIS 数据管理 可以认 为一 个地 物对 应于 数据表 中的 一条 记录 , 这样 它带来 的最 直接 的好 处是 避免了 对 “连接 关系 ” 的 查找 。 目 前, 关 系 数 据 库 不 论 是 理 论还是 工具 , 都 已经 成熟 , 它 们 提 供 了 一 致的访 问接 口 ( SQL) 以 操作分 布的 海量 数据 , 并 且支持 多用 户并 发访 问 , 安全性 控制 和一 致性检 查 。 这 些正是 构造 企业级 的地 理信 息系 统所 需要的 , 此 外 , 通 用 的 访 问接口 也便 于实 现数据共享。 采 用 全关系 GIS 数据 管理, 由于 几何 体坐 标数 据不定 长, 会造 成存 储效 率低下 , 此 外, 现有的 SQL 并不支持 空间 数据检 索, 需要 软件 厂商 自行开 发空 间数 据访 问接 口,如 果要 支 持空间数据共享,则要对 SQL 进行扩展。 4. 4 采用面向对象数据库 (OO-DBMS)管理 如果应 用对 象数 据库 管理 GIS 数据, 则可 以扩 充对 象数据 库中 的数 据类 型以 支持空 间 数据, 包括 点、 线、 多 边 形等几 何体 , 并 且允 许定 义对于 这些 几何 体的 基本 操作, 包括 计算 距离、 检测 空间 关系 , 甚 至稍微 复杂 的运 算, 如缓 冲区计 算、 叠加 复合 模型 等, 也 可 以 由 对 象数据库管理系统“无缝”地支持。 这样, 通过 对象 数据 库管 理系统 , 提 供了 对于 各种 数据的 一致 的访 问接 口以 及部分 空间 模型服 务, 不仅 实现 了数 据共享 ,而 且空 间模 型服 务也可 以共 享, 使 GIS 软件开发 可以 将 重点放在数据表现以及复杂的专业模型上(图 16-13) 。 不过 , 目前 对象 数据 库管 理系 统 远 未 成熟, 许 多 的 技 术 问题仍 需要 进一 步的 研究 。 例如, 由于支 持用 户自 定义 功能 , 可 能 会 引 发 对 系 统 的 恶 意入侵 。 查 询优 化也 是对 象数据 库所 面临 的一个 难题 , 假定要 进行 查询操 作 , 得 到所有 有铁 路通过 并且 人口 大 于 10 万的 县, 很明 显 , 得到人 口大 于 10 万的 县所 需要的 计算 时间 要远 远小 于得到 所有 铁路 通过 的县 的时间 ,系 统 必须了 解这 一点 ,在 执行 查询时 ,先 得到 人口 大于 10 万的 县, 然后 再在 该集 合中依 据空 间 关系进行进 一步的 查找 ——而不考 虑用户 的实 际输入次序 。该处 理过 程称为查询 优化 ( Optimize) , 它 使 得优化后 的计算 时间减少 。对于这 种简单 的情况, 即结构化 查询和 空间 运算的 消耗 时间 , 容 易比 较判断 , 但 是 如果查 询语 句中包 括多 个空 间运 算函 数, 那么 其优 化 将变得十分困难。 空间 数据库 数据库访问 接口 空间模型服 务 GIS 应用 GIS 应用 GIS 应用 OO - DB M S GI S 空间模型服 务 图 16-13:采用 OO-DBMS 进行 GIS 数据管理 5.界面设计 5. 1 界面设计原则 在设计阶段,除了设计算法,数据结构等内容外,一个很重要的部分就是系统界面的设 计,系统界面是人机交互的接口,包括人如何命令系统以及系统如何向用户提交信息。一个 设计良好的用户界面使得用户更容易掌握系统,从而增加用户对系统的接受程度。此外,系 统用户界面直接影响了用户在使用系统时的情绪,下面的一些情形无疑会使用户感到厌倦和 茫然: 1)过于花哨的界面,使用户难以理解其具体含义,不知从何入手; 2)摸棱两可的提示; 3)长时间(超过十秒)的反应; 4)额外的操作(用户本意是只做这件事情,但是系统除了完成这件事之外,还做了另 外的事情) 。 与之相反,一个成功的用户界面必然是以用户为中心的,集成的和互动的。 尽管目前图形用户界面(GUI,Graphical User Interface )已经被广泛的采用,并且有很多 界面设计工具的支持,但是,由于上述的这些原因,在系统开发过程中应该将界面设计放在 相当重要的位置上。 设计用户界面的策略由以下几点构成 [Peter Coad,Edward Yourdon]: 1)对人分类 通过仔细研究使用系统的人,对其进行分类,分类的原则包括按照技能层次(初学者, 高级人员…) ,按照组织层次(管理人员,一般员工 …) ,按照身份(职员,顾客…) 。通过 分类,弄清每类人员使用系统的目的,进而可以确定其相应的人机交互操作。 2)描述人和他们的任务脚本 对人员分类之后,确定每一类人员的特征,包括使用系统的目的,特征(年龄、教育水 平、限制等) ,对系统的期望(必须 /想要,喜欢 /不喜欢 /有偏见) ,熟练程度,使用系统的任 务脚本(scenario ) 。依据这些特征,可以指导系统的人机交互设计。 3)设计命令层 命令层的设计包括三个方面的工作,即研究现有的用户交互活动的寓意和准则;建立一 个初始化的命令层;细化命令层。 在图形用户界面的设计过程中,已经形成了一些形式的或非形式的准则和寓意,如菜单 排列(例如,在几乎所有的 MS-Windows 应用系统中,前三个一级菜单项目总是“文件” 、 “编辑” 、 “视图”,而最后的两个则是“窗口” , “帮助” ) ,一些操作(例如,打开文件、保 存文件、打印)的图形隐喻等等。遵循这些准则,便于用户更快地熟悉系统。 在细化命令层时,需要考虑排列,整体 -部分组合,宽度与深度的对比,最小操作步骤 等问题。一个层次太“深”命令项目会让用户难以发现,而太多命令项目则使用户难以掌握。 4)设计详细的交互 人机交互的设计有若干准则,包括: 一致性 采用一致术语、一致的步骤和一致的活动; 操作步骤少 使敲击键盘和点按鼠标的次数减到最少; 不要“哑播放” 长时间的操作需要告诉用户进展的状况; 闭包 用一些小步骤引出定义良好的活动,用户应该感觉到他们的活动 中闭包的意义; Undo 人难免做错事, 通常在这种情况下系统应该支持恢复原状,或者至少部分的支持。 减少人脑的记忆负担 不应该要求人从一个窗口记忆或者写下一些信息然后在另一个窗 口中使用; 学习的时间和效果 为更多的高级特性提供联机参考信息; 趣味和吸引力 人们通常喜欢使用那些感到有趣的软件。 5)继续做原型 通过做原型系统,可以直接的了解用户对设计界面的反应,然后进行改善,使之臻于完 美。 6)设计用户界面类 在完成上面的工作后,就可以着手设计用户界面类。在开发 GUI 程序时,通常已经提 供了一系列通用界面类,如窗口、按钮、菜单等等,只要从这些类派生特定的子类即可。 7)根据图形用户界面进行设计 目前主要的 GUI 包括 Windows, Macintosh, X-Windows, Motif 等,基于它们开发应用 软件可以使界面的设计简单化,但是事先要清楚其特性,如事件处理方式等等。 5. 2 GIS 界面设计中的要素 对于成功的 GIS 软件,好的界面是不可或缺的,在进行设计时,同样要遵循上述的原 则和步骤。对于地理信息系统软件而言,其界面需要允许用户选择并检索相应的空间数据, 操作这些数据,并且表现分析的结果。对于基本的数据检索,操作和表现,与普通的软件是 一致的,在 GIS 中要考虑的是以下几个要素: 5. 2. 1 数据选择 选择数据采用的过滤器可能包括空间的和非空间的属性,或者是两者的结合,例如(针 对一个县级行政区划数据) : g108g32检索所有人口大于 10 万的县; g108g32检索所有有铁路通过的县; g108g32检索所有有铁路通过并且人口大于 10 万的县; 用户可以通过输入一个命令语句,通过菜单选择,填充一个表单( Form) ,或者通过直 接的操作——例如使用鼠标来选择数据。利用命令语句需要了解数据表的结构,并且需要对 传统的 SQL 进行扩展以支持空间过滤。直接操作选择需要数据显示在屏幕上,它和 SQL 查 询的组合通常要间接的完成。当一些地物显示在相近的位置时,直接操作选择会有二义性。 为了方便用户操作,要提供一些额外的操作,如漫游、放大显示、缩小显示等。 5. 2. 2 数据表现 一种好的数据表现形式有利于用户直接操作以进行进一步的分析, 与标准的关系数据库 相比,在地理信息系统中,需要更多地考虑其图形显示。图形表现的相似性或者差异可以表 达给用户这些地物对象具有某种程度相似性,一些图形显示的变量有: g108g32多边形轮廓:颜色,灰度,黑白;线型; g108g32多边形填充:颜色,灰度,黑白;填充模式; g108g32线:颜色,灰度,黑白;线型; g108g32符号:颜色,灰度,黑白;形状;大小等等。 对于图形显示而言,需要进行仔细设计,以正确地表达地物对象的含义,并被用户理解。 5. 2. 3 数据处理 数据处理由一系列空间的和非空间的操作组成,一个设计良好的界面使实现这些操作更 加容易。与标准的关系数据库相比, GIS 所管理的数据更具有面向对象的特征,所以一个面 向对象界面有利于用户与系统的交互操作,完成数据处理。在 GIS 软件中,面向对象的界 面设计包括将地理实体,如点、线、多边形以及一些操作以象形的符号表现出来,而用户可 以通过简单的点击、拖放等操作实现相应的数据处理。 下面列出了一些具有图形寓意的操作,很容易将图形表现与对应的操作联系起来。 g108g32创建:根据给定的图形实体以及相应的属性,创建一个空间对象; g108g32删除:删除一个选定的空间对象; g108g32集合:根据选择的对象形成一个集合; g108g32更新:只显示最后一次操作的结果; g108g32叠合:相当于集合操作中的并运算; g108g32求交:相当于集合操作中的交运算; g108g32求差:相当于集合操作中的差运算; g108g32转换:对选择的地物进行比例、移动、镜象、仿射变换等操作; g108g32检查点:设置检查点,当对后面工作不满意时,可以回退到该点; g108g32回送:返回上一个检查点的状态; g108g32提交:将所有的处理结果传给数据库,并更新之。 5. 2. 4 SQL 传统的 SQL 并不能处理空间查询,这是由于关系数据库技术的弱点造成的,对于 GIS 而言,需要对 SQL 进行扩展。目前正在制定的 SQL/MM,主要应用于多媒体数据,其中包 含了全面的 GIS 操作集合。 采用新的 SQL 标准,带来了概念上的改变,对于传统的 SQL,要实现空间操作,需要 将 SQL 命令嵌入一种编程语言中,如 C 语言;而新的 SQL 允许用户定义自己的操作,并嵌 入到 SQL 命令中。 这种扩展的 SQL 实际上是增加了面向对象的支持,在地理信息系统中,称为 GeoSQL, GeoSQL,可以写出形如: SELECT Soils.Map From Soils,Parcels Where Parcels.Value>6000 and Overlay(Soils,Parcels); 的查询命令。 由于完全实现 GeoSQL 仍然有相当的难度,所以目前大多数 GIS 软件的实现思路是分 别输入标准 SQL 查询语句以及空间查询(图 16-14) ,然后分开处理,最后将结果合并,其 缺点是不够灵活。 图 16-14:一个实现空间查询的界面,将空间关系和标准 SQL 分开输入 5. 2. 5 可视化 由于地理信息系 统是基于 图形的,其分析 和解释的 结果通常是以可 视化的形 式表现出 来 。 可视 化是 指为 了识 别、 沟 通 和 解 释 模 式 或 结 构 , 概 括性 地表 现信 息的 过程 。 空 间 分 析 需 要考虑 信息 模式 以及 空间 特征的 感受, 对 于 GIS, 可 视化可 以描 述为 从信 息到 知识的 转化 过 程。对于地 理信息 系统 ,除了以可 视化的 形式 表现各种信 息,实 现表 达的所见即 所得 (WYSIWYS, What You See Is What You Get)亦是界面设计的重要原则。 5. 3 GIS 界面样式 在 GIS 软件 界面 设计 中, 有三种 基本 的用 户界 面样 式,即 基于 命令 的界 面、 菜单驱 动 的界面 以及 基于 工作 流的 GUI 界面, 这三 种界 面对 于实现 和使 用各 有其 长处 和短处 ,在 具 体实现时,可以同时支持一种或几种样式。 5. 3. 1 基于命令行的 GIS 界面(图 16-15) 命令行 是最 简单 的界 面样 式, 并 且 很 早 就 已 经 在 各 种操作 系统 软件 中被 采用 。 它 只 使 用 文本语 言 , 要 求用户 了解 可以使 用的 选项 , 这 需要 记忆各 种命 令或 者不 断查 找帮助 文档 。 基 于命令 行的 界面 不提 供任 何提示 信息 和建 议, 这使 用户要 依赖 于印 刷文 档来 学习系 统。 采用 命令行 界面 需要 开发 一个 命令行 解释 器 , 在命 令行 界面 软 件中, 功能 模块 之间 关系 较 为 简 单 , 常常是 一个 模块 的输 出作 为另一 个模 块的 输入 , 便 于开发 实现 。 利 用批 命令 文件或 者脚 本文 件,可以依次完成多步操作,这是命令行界面的长处。 对于 GIS 软件, 因为 包含 大量的 图形 操作 ,所 以采 用命令 行界 面时 ,需 要有 一个图 形 窗口以 显示 操作 结果 , 这 样命令 行界 面起 到控 制台 的作用 。 由 于 支持批 命令 和脚本 文件 , 可 以使用命令行界面来实现批量的、流程化的、耗时的数据处理。 图 16-15:基于命令行的 GIS 界面 5. 3. 2 菜单驱动的 GIS 界面(图 16-16) 在 MS-Windows 成为 PC 上的主 流操 作系 统之 后 , 菜单驱 动的 用户 界面 几乎 在所有 的应 用软件 中被 采用 。 它按 照层次 , 列出 了系 统提 供所 有操作 , 用户 可以 通过 键盘 或者指 点 设 备 , 通常是 鼠标 , 来选择 并执 行一个 操作 。 每个菜 单项 目都有 相应 的帮 助信 息, 便于用 户随 时 参 看。 菜单驱 动界 面最 大的 长处 在于界 面友 好, 便于 用户 掌握系 统。 但是 对于 高级 用户而 言 , 与命令 行界 面相 比, 它往 往显得 不够 灵活 而且 效率 低下。 在 GIS 中,往 往需 要连续 地对 批 量数据进行处理,并且需要较长的计算时间,这种情况下采用菜单界面就变得不可忍受。 图 16-16: Windows 环境下菜单驱动的 GIS 界面 5. 3. 3 采用数据流图的 GIS 图形用户界面(图 16-17) 在图形 数据 流界面 中, 操 作者通 过一 种“可 视化 的 语言” ,而 不是 严格 的 文本来 控 制 系 统,其 中,系 统用图 形符 号来表 现其提 供的功 能, 称为“ 图标” 。 图 标 不仅可 以表示 操作, 也可以表示数据或者硬件设备。 在基于 数据 流图 的用 户界 面中, 用户 可以 通过 “拖 放( Drag and Drop) ”操 作来 实 现 相 应的操 作 ( 例 如 , 可 以 将 表示插 值计 算的 图标 拖放 到表示 等值 线数 据的 图标 上, 以进 行等 值 线插值运算) ,设计和组织数据处理流程。 数据流 图界 面适 用于 数据 流清晰 , 相 对比 较简 单的 系统, 如数 字图 像处 理软 件; 其 缺 点 是实现较为困难。 图 16-17:采用数据流图的 GIS 图形用户界面 6. GIS 中的设计模式 随着面 向对 象技 术的 广泛 应用, 软件 复用 在越 来越 多的开 发过 程中 被采 用。 在研究 软件 复用的 过程 中, 设计 模式 (Design Pattern)的概 念被 提 了出来 。所 谓设 计模 式, 简单地 理解 , 是一些 设计 面向 对象 的软 件的经 验总 结。 正 如 Alexander 针对 建筑 领域 所说 的: “每 个模 式 描述了 一个 在我 们身 边一 再发生 的问 题, 它告 诉你 这个问 题的 解的 关键 , 以 使你可 以成 千上 万次的 利用 这个 解, 而不 需要再 一次 去解 它。 ” , 在 软件开 发过 程中 使用 设计 模式 , 可 以利 用 已有的设计经验,指导软件复用。 一个设计模式,一般包括以下四个基本部分: 1)模式名称: 描述一个设计问题、它的解法和后果; 2)问题: 告诉什么时候要使用该设计模式,解释问题及其背景; 3)解决方案: 描述设计的基本要素 、它们的关系、各自的任务以及相互之间的合作; 4)后果: 描述应用设计模式之后的结果和权衡。 E.Gamma 提出了 23 个 面 向对象 的设 计模 式, 这些 模式抽 象层 次较 高, 可以 应用于 所有 软件的 开发 过程 。 在 地理 信息系 统开 发中 , 经 常会 遇到本 领域 的特 定的 一些 问题 , 并 且已 经 形成了 有效 的解 决方 案, 对其进 行归 纳总 结, 形成 相应的 设计 模式 ,对 于 GIS 软件 开发 , 有着重要的意义。下面遵循 E.Gamma 的格式给出了一个 GIS 设计模式范例。 名称: 过滤和精化( Filter and Refine) 内容: 定义了对一个大数据量的空间数据库的访问接口 另外的名称: 空间索引和最小外包矩形 动机: 在空间 数据 中, 一个 通常 的查询 操作 是空 间检 索, 即根据 给定 的点 或者 区域 得到相 应的 地物对象,在这些情形中,系统必须要有快的响应速度。 一个最 简单 的解 决办 法是 依次得 到每 个地 物 A i ,并 计 算 A i 和给定的 点 ( 或区 域) 的 空 间 关系, 如果 符合 条件 , 则 返回该 地物 对象 。 这 个方 法的缺 点是 显而 易见 的, 首先, 它需 要对 空间数 据库 中的 所有 地物 进行比 较运 算 ; 其次 , 空 间关系 的计 算需 要大 量浮 点运算 , 直 接 进 行给定点(或区域)和地物的空间关系,速度会很慢。 为了提 高空 间检 索效 率, 有两个 解决 的途 径。 首先, 可以计 算每 个地 物的 最小 外包矩 形 ( MBR-Minimum Bounding Rectangle) ,这 样进 行空 间关系 计算 时, 可以 先通 过外包 矩形 来 判断 , 可 以排 除掉根 本不 可能具 有相 交或 者包 含关 系的情 形 , 然 后再按 照常 规的算 法 ( 如 射 线算法 等等 ) 进 行 计 算 。 其次 , 考 虑到 采用 MBR之后 , 仍 旧要 计算 每一 个地物 A i ,当 地 物 数 目很多 时, 依然 需要 较长 的查找 时间 。 解 决该 问题 的一个 方案 是将 数据 库的 空间范 围进 行分 割,一 般是 划分 成为 矩形 ,然后 计算 并记 录每 个矩 形包含 或者 相交 的地 物, 形成空 间索 引 。 在进行 空间 检索 时, 根据 给定的 点 ( 或区 域) 得到 其对应 的索 引块 , 这 样就 可以只 判断 与索 引块相 关的 地物 ,从 而减 少了查 找时 间。 通常 前一 个操作 称为 精化 ,后 一个 操作叫 做过 滤 。 下面以中国行政区划数据 (图 16-18-a)简单描述该过程。 (a) (b) 图 16-18:中国行政区划和对应的 MBR ( a) (b) 图 16:通过空间索引进行过滤 如图 16-19-a 所示,每一索引块都记录了其相应的地物,形如: D5g224湖北,江西,浙江,台湾,湖南,广东,福建 C4g224内蒙古,甘肃,陕西,山西,河南,湖北,四川,青海,宁夏 而每个地物都记录其最小外包矩形,如图 16-18-b 所示。 当根据 给定 点 P(图 16-19-a)查找包 含该 点的 地物 时, 首先判 断 P 位于 C4 索引块 , 这 样 就可以 只判 断 P 与 C4 索 引块对 应地 物的 关系 ; 再 由外包 矩形 , 可 以得 到 P 只可能 在四 川省 或陕西省内 (图 16-19-b),然后就可以采用传统的空间关系计算方法,得到确切的结果— — 四川省。 应用: 过滤和 精化 可以 应用 于根 据点或 者区 域对 大数 据量 的空间 数据 库的 检索 (点, PAM-Point Access Method;区 域 , SAM-Spatial Access Method) , 而 空间 数据 库由 线或 多边 形 地 物 组成。 结构: 图 16-20:过滤和精化模式结构图 参与者: g108g32 FeatureSet: —— 定义由地理要素组成空间数据库。 g108g32 Feture: ——实现了地物对象。 g108g32 SpatialIndex: ——管理和维护空间索引,可以得到每一索引块对应的地物,提供过滤功能。 g108g32 MBR: ——地物的最小外包矩形,通过 MBR 可以实现精化功能。 g108g32 Partition: ——对应于空间数据分割后的每一块矩形区域。 协作: FeatureSet 利用 SpatialIndex 得到可能符合条件的地物对象集合,然后利用 MBR 去除绝 对不可能满足条件的地物。 对空间数据库的任何涉及空间坐标的编辑修改都要重新计算 MBR 和维护空间索引,在 要求精度较低的情况下,可以利用最小外包矩形建立空间索引。 后果: 很明显,因为要记录空间索引和最小外包矩形,采用过滤和精化增加了内存开销。索引 块的确定是一个重要的因素,如果太小,会有大量地物跨越多于一个的索引块,进一步增加 了数据量;而如果太大,过滤的效果不会很明显。如果地物的空间分布不均匀,一般要采用 不均匀的分割策略,如四叉树等等。此外,为了保证查询结果的正确性,对地物的每一次编 辑修改,都要重新计算其最小外包矩形,并维护空间索引,这需要额外的时间开销,并增加 了程序的复杂度。考虑到上述因素,对于数据量较小的情形,一般不建立空间索引。因为点 地理要素结构简单,并且数据量小,并且容易计算空间关系,所以对于由点地物对象构成的 数据,一般不建立空间索引,并且对于单个点而言,最小外包矩形也是没有意义的。 变化: 为了提高查找效率,可以建立基于四叉树、平衡二叉树等基于树数据结构的空间索引。 可以使用最小外包直角多边形代替最小外包矩形,前者更好地逼近几何实体的形状,提 高了精化的效率,但是需要更多的存储空间,并且计算直角多边形运算量较大。 实现: 下面是采用 C++语言描述的采用过滤和精化的空间检索过程,为了简便起见,只是给 出了基于点的访问 (PAM),其中 FeatureSet 类表示由地理要素组成的空间数据库, FeatureSet 的成员变量 m_SpatialIndex 为其空间索引, FeatureSet 类的方法 GetObjectsUsingPAM 目的是根据给定的点得到符合条件地物的列表; Feature 类表示地理 要素, Feature 类的成员变量 m_rectMBR 为其最小外包矩形。 void FeatureSet::GetObjectsUsingPAM(Point ptPoint,Array *arFeatures) const { Partition *pPartition = GetRelativePartition(ptPoint); Array arRelativeFeatures; int nFeaturesCount = m_SpatialIndex->FindFeatures(pPartition,&arRelativeFeatures); Feature *pFeature; for(int i=0 ; i<nFeaturesCount; i++) { pFeature = (Feature *)arRelativeFeatures.GetAt(i); if(!pFeature->m_rectMBR.IsPointContained(ptPoint)) continue; if(pFeature->IsRelationshipFitted(ptPoint)) arFeatures->Add(pFeature); } } 广义上讲,一个设计模式可以是一个算法、一种数据结构,但是在实践中,模式一般由 一组协作的类构成,可以完成特定的任务。在地理信息系统软件开发过程中,利用形式化、 半形式化的语言来记录设计模式,可以较好地指导软件复用,提高软件生产率。 7.在 GIS 项目中使用 CASE 工具——空间过程支持与空间 数据配置管理 CASE(计算机辅助软件工程, Computer-Aided Software Engineering) ,是辅助计算机软 件开发的计算机技术,包括在软件开发、维护过程中提供计算机辅助支持以及在软件开发、 维护过程中引入工程化方法。 CASE 工具是一类特殊的软件工具,用于辅助开发、测试、分 析和维护另一个计算机程序及相关文档。 CASE 工具可以分为以下一些类型,即管理工具、 编辑工具、配置管理工具、原型工具、方法支持工具、语言处理工具、程序分析工具、测试 工具、调试工具、文档工具和再工程工具等,它们可以用来辅助软件开发过程中不同的活动。 上述的 CASE 工具,同样可以直接应用于 GIS 软件开发过程中,辅助实施相应的软件 开发活动。此外,还可以针对 GIS 领域,对 CASE 工具进行特化,使之更好地支持地理信 息系统开发活动。下面讲述的在 GIS 开发中, CASE 工具另一个方面的应用:应用配置管理 工具实现空间过程支持和空间数据配置管理。 软件配置管理(Configuration Management)是一种标识、组织和控制修改的技术,可以使 软件开发过程由于变更修改引起的混乱降低到最小程度。 目前, 配置管理工具已经比较成熟, 提供的基本功能包括: 1)配置标识 在软件开发过程中,各种相关的文档在不断地变更,在变更过程中每一个时刻的内容都 称为一个配置,可以命名配置以实现控制和管理。 2)版本控制 版本控制用来管理软件工程过程中所建立起来的配置对象的不同版本。 3)变更控制 变更控制通过“检出(Check out ) ”和“登入 (Check in)”机制实现在多人共同开发软件 时,不至于因为共同修改同一文件引起混乱。 4)配置状态报告 配置状态报告通过系统地记录开发过程,反映开发活动的历史情况。 5)配置审核 配置审核的目的是为了证实整个软件生存期中各项产品在技术上和管理上的完整性, 并 保证所有文档的内容变动不超出当初确定的软件要求范围。 实际上,通过控制不同版本的配置,可以实现整个软件过程的管理,跟踪每份文档的变 化, 确定文档之间的依赖性。 这些特性,同样可以应用于空间过程和空间数据的管理和控制。 在一个较大规模的 GIS 应用软件的建立过程中,常常要处理大量的数据,概括地说, 具有以下特征: 1)数据量大; 2)数据经常变更,比如从遥感图像解译得到的土地利用图以及地籍图; 3)对一份或多份数据的空间模型运算,可以得到派生的数据,换言之,数据之间通过 空间模型产生了依赖性; 4)空间模型也是在不断变化。 这时,数据变得混乱而难于控制,管理人员无法了解整个项目的进度。在 GIS 中引入 配置管理的概念,可以管理空间数据和空间模型的多个版本,进而支持空间过程,辅助 GIS 应用系统的建立。 过程(Process) 的概念目前被应用于不同的领域,指被“元程序(Meta-program) ”控制的 计算机 程序 以及 数据 交换 复杂的 序列 。 过 程的 概念, 在解决 与异 种平 台和 应用 环境相 关的 一 些问题时,是非常有帮助的。这样的问题包括: 1)互操作 ,它可以在过程的基础上得到解决而不是限于普通的情形。 2)分布 ,在基于已经存在的工具编写分布应用程序时,提供了充分的支持。 3)前向恢复 ,通过使用数据库持久记录过程中的每一步来得到保证。 4)监控 ,基于保存在数据库中的过程的当前状态和前状态来实现。 5)历史回溯 ,基于对存贮过程状态数据库的查询和数据挖掘工作来实现。 这些问 题在 许多 不同 的应 用领域 很普 遍地 出现 , 从虚 拟企业 和商 业环 境到 软件 工程和 科 学数据管理,这说明了过程概念应用的广泛性。 对于地 理信 息系 统而 言 , 大 部分的 研究 活动 集中 于以 下一些 问题 : 空间 数据 表现 , 索引 , 存储和 检索 。 可以说 , 这 只是试 图针 对传 统数 据集 进行数 据库 技术 扩展 的结 果。 而空 间过 程 问题,不仅仅只是与空间模型有关,下面用一个例子进行说明。 图 16-21 是 一 个 典 型 的 空 间模型 组合 ,形 成应 用于 不同数 据集 的变 换序 列 * 。 例如, 高 程采样 数据 作为 数值 高程 重建算 法的 输入 , 生 成带 有内插 高程 的地 形图 。 然 后地形 图被 坡面 分析程 序使 用, 以提 取不 同坡面 的坡 长, 坡度 和坡 向。 这 些 结 果 , 连 同 该 区 域的土 壤抽 样数 据和植 被覆 盖信 息, 被用 于作为 试图 预测 该区 域未 来侵蚀 模式 模型 的输 入数 据。 植 被 覆 盖 数 据通过 综合 分析 土壤 抽样 数据, 植被 抽样 数据 和卫 星图像 得到 。 植 被覆 盖数 据也作 为植 被演 替模型 的输 入数 据, 该模 型根据 预测 的侵 蚀数 据, 估算未 来可 能的 植被 覆盖 变化 。 在 考虑 到 降水量 的影 响时 ,也 是相 似的逐 步的 过程 。图 21 表 现了所 有的 空间 模型 组织 在一起 ,形 成 一个复杂的操作集合,表现不同的地理现象。 图 16-21:空间过程的例子:水土流失模型[G.Alonso] 这个例 子阐 明了 一些 需求 , 很 自 然 , 这 些需 求与 过程 管理的 需求 非常 相似 。 下 面列出 这 些必要的、简化的需求,包括模型语言,分布和并行以及查询能力。 1)模型语言: 在 任 何一个 过程支 持系 统中 ,其关 键 成分就 是可 以表 述过程 的 语言。 给 定一个 复杂 的地 理过 程模 型, 模型 语言 必须 是结 构化的 , 允许 嵌套 , 并且 可以 被方 便 地 重 用 。 任何地 理过 程应 该可 以方 便地被 用于 构造 一个 更大 的地理 过程 。 此 外, 考 虑 到 复杂的 执行 环 境,该 语言 必须 提供 对事 件和例 外处 理机 制的 支持 。事件 可以 被用 于在 数据 集发生 改变 时 , * 下面,空间模型和空间过程都被使用,抽象的看,模型是地理现象的表现,而过程是用程序和数据集描 述地理现象。 通知系统并且触发执行模型,以产生更新的数据。类似地,考虑到例外,必须存在一个可靠 的机制来处理它们,以避免系统偏离预先描述的行为,造成整个模型执行的退出。由于在工 作流系统中,该语言必须允许定义和注册外部对象以及应用。在地理过程的应用中,更应该 这样,这是因为在地理过程管理中,不论算法还是空间数据都将外在于系统,外部实体的注 册是互操作性问题的基础。 2)分布和并行中的前向恢复:为了降低这种复杂的地理过程执行的开销,只要可能, 它们的不同的步骤应该并行。一般来讲,我们假定基本的平台是一组 (cluster)微机或工作站, 不要求是相同的操作系统。地理过程中的每一个步骤都可以被指派到这一组中的不同的结点 上,因此采用并行机制是模型固有的特征。同样地,多处理器的机器也采用类似的实现。作 为其直接后果,并且由于模型的成本和执行它们所用的时间,必须有一种机制,以避免当发 生错误时,所有的计算丢失。这就是前向恢复的概念,它可以从由于错误引起的中断处恢复 执行。如果提供一个系统,其中复杂的地理过程只能从头到尾的执行而不能在中间中断,也 不能动态修改地理过程以纠正错误,这样的系统将是无用的。通常的,构造一个地理过程与 其说是为了得到其结果,不如说是测试相关地理模型的合法性和可用性。基于这些理由,系 统必须支持单步执行,并且能够在任何执行点上停止,进行检查,作出改变以及恢复执行。 这样的功能只能通过对地理过程执行的精确监测来实现。 3)依赖性查询能力:在地理过程中,如果对模型和输入数据不了解,那么就不能很好 地解释利用该数据和模型产生的数据。这样就引出了那些众所周知的问题如“族系跟踪 (Lineage tracking)”, “变化传播 (Change propagation)”以及“版本” ,这些概念与更加一般的 过程中的历史跟踪没有什么不同。在这种环境中,将有这样一些典型的查询问题,例如“哪 一个模型用到了算法 X?” , “”如果数据集 Y 发生改变,将会产生什么结果?”以及“哪 些数据用于产生数据 Z?” 。因此,系统必须支持如下的一些功能,包括:自动变化传播(当 输入数据发生改变时,重新执行模型,以创建新版本的输出数据),变化通知以及过程控制 (只要一个数据集存在,创建它所使用的模型将保留一个拷贝;同样的,只要有其它过程使 用了一个子过程,也保留该子过程的拷贝),这样系统才能真正有用。只有具有合适的机制 来跟踪数据之间的依赖性,并且有高效的方法从这些依赖性中提取信息,系统才能很好地提 供上述功能。 过程建模是当前软件工程一个重要的研究方向,通过形式化地描述开发过程,进而实现 更加“精确”的过程管理,它同样可以应用于空间过程。由于过程本身的复杂度,使得难以 建立完整的过程模型,利用配置管理工具,可以在一定程度上实现数据、模型乃至过程的控 制管理。 在信息技术产业,要害一个人,就让他去开发一个市场标准。 虞有澄(前 Intel 副总裁) 第十七章 地理信息系统标准 导读:信息技术的标准对于产业的发展有着重要的意义,GIS也不例外,目前GIS 标准主要集中于空间数据模型和空间服务模型以及相关领域,此外还包括流程、认 证等等。本章介绍了两个主要的GIS标准:ISO/TC 211和OpenGIS。 1.地理信息系统标准简介 随着 GIS 技术的发展,特别是网络技术应用到地理信息系统建设中,与它有关的标准 化也成为一个必须解决的问题。一个好的标准是促进、指导和保证高效率、高质量地理信息 交流不可缺少的部分。 在信息技术领域,标准和规范按照其使用状态,可以分为两种,即实际使用的标准和法 律意义上的标准。前者是在不断的实践过程中,有关机构、团体和组织自发达成的被广泛接 受的标准,如 TCP/IP 协议,OpenGIS 规范;后者通常是为了政策或管理的目的,通过法律 制定的标准,如 FGDC 制定的空间元数据内容标准。 按照管辖地区的大小,制定信息技术的标准化组织可以分为五个层次( Cargill),即国 际级标准化组织,如 ISO;区域级标准化组织;国家级标准化组织,如美国国家标准化组织 ANSI以及美国联邦地理数据委员会;政府和用户级标准化组织,在 GIS 领域, OGC(OpenGIS) 就属于该层次;以及补充性标准化组织。 目前在中国, GB 系列中与 GIS 有关的标准主要是一些地理编码标准,包括: GB2260-80 《中华人民共和国行政区划代码》 , GB/T13923-92《国土基础信息数据分类与代码》 , GB14804-93《1 : 500、 1: 1000、 1: 2000 地形图要素分类与代码》, GB/T5660-1995《1 : 5000、 1:10000、1:25000、1:100000 地形图要素分类与代码》等。 通常,信息技术的标准和规范可以分为以下五个方面: 1)硬件设备的标准,在网络技术中,存在着大量这种标准,如 IEEE 802 系列; 2)软件方面的标准,包括操作系统,查询语言,程序设计语言,图形用户界面等等, 如 SQL,DCOM ,CORBA 等等; 3)数据和格式的标准,包括数据模型,数据库的构建,数据质量和可靠性,地理要素 的分类系统,数据格式转换等,在地理信息应用中,空间数据编码规范、元数据标准等就属 于该范畴; 4)数据集标准,数据存放的文件格式标准,如美国人口普查局的 TIGER 文件标准等; 5)过程标准,如 ISO9000 系列和 CMM 等,主要是针对系统开发过程的指导。 地理信息系统标准化主要包括后四个方面的标准,具体内容有:软件工具,如文档,设 计、验收、评测标准以及软件的接口规范等;数据,包括数据模型,数据质量,数据产品, 数据交换,数据显示,空间坐标投影等;系统开发,系统设计过程,数据工艺流程,标准建 库流程等;其它,包括名词术语,管理办法等。一般而言,软件工具,系统开发,管理办法 等方面的标准可以借用更为通用的信息技术标准规范,所以 GIS 标准主要集中于空间数据 以及相关的一系列规范。 应用地理信息系统标准,可以建立一套较为规范数据的录入处理流程,提高工作效率和 质量,同时采用一致的数据格式以及空间数据可视化方式,指导数据的使用。 总而言 之 , 在 地 理 信 息 系 统中引 入一 系列 标准 , 有 利于保 障地 理信 息系 统技 术及其 应用 的规范 化发 展 , 指 导 地 理 信息系 统相 关的 实践 活动 , 拓 展地 理信 息系 统的 应 用领域 , 从 而 实 现地理 信息 系统 的社 会及 经济价 值 。 基 于 地 理 信 息 系统标 准 , 可 以 实 现 不 同 应用领 域地 理信 息的共享和互操作,这也正是实现数字地球的关键技术之一(图 17-1) 。 软件 /工具 标准流程 /过程 标准 数据标 准 管理标 准 数据生 产 术语标 准 数据处 理和 使用 GIS 软件 开发 基于构 件的 支持 分 布平台 的 GIS 系统 规范数 据生 产过 程 保障数 据质 量 空间数 据共 享 空间数 据共 享和 互操 作 GIS 应用 的社 会化 国家空 间信 息基 础设 施 数字地 球 应用广 度 图 17-1:地理信息标准对地理信息系统应用的意义 ISO 的标准制定过程: [Cargill] ISO 标准的制定过程主要分为以下几个步骤: ( 1) 由子委员会起草新的工作内容计划书,提交一个技术委员会投票表决; ( 2) 表决通过后,再交由该子委员会负责有关标准制定的各项活动; ( 3) 子委员会下属的工作小组起草标准工作草案,交由子委员会投票表决; ( 4) 若子委员会统一标准工作 草案,该草案成为标准草 案计划书,并在整个技术 委员会 中传阅; ( 5) 若技术委员会对草案计划 书也能够达成共识,该标 准草案将被作为国际标准 草案送 至技术委员会负责人手中; ( 6) 技术委员会负责人将对国际标准草案进行核实,审查是否 符 合 ISO 的原则和要求; ( 7) 若审查 通过 , 该 国 际 标 准 草案将 被送 至 ISO 的各 国 成员中 传阅 , 征 求 意 见 , 并表决 , 如果 由 75%的成 员表 决通 过, 则将 提交 至 ISO 的 执 行委员 会作 为 ISO 的标 准 出版发 行。 目前 , 有 很多 个组 织和 政 府部门 召集 或主 持制 定地 理信息 系统 标准 , 其 内 容 主要包 括空 间数据 模型 和空 间服 务模 型以及 在此 基础 上的 空间 数据共 享 ( Data Sharing) 和互操 作 ( Data Interoperation ) 。 其 中比较 主要的是 地理信息 / 地球信息 科学 (Geographic information/Geomatics)专业委 员会 制定 的 ISO/TC211 地理 信息 标准 以及 OGC(Open GIS Consortium)制定的 Open GIS。 与 Open GIS 相比, ISO/TC211 更为全面,更注重于标准本身的定义,可以指导地理信 息系统开发和使用的各个方面;而 OpenGIS 由于有许多著名的 GIS 软件开发商参与,因而 更加注重软件的实现。 地理数据的互操作: 随着地理信息系统的发展,需要实现地理数据共享,而互操作则是数据共享的必然产物。 在传统的、以数据集中式管理为特色的地理信息系统应用中,实现数据共享的手段主要 是通过数据交换来完成,具体方式包括通过相关表或转换器的直接转换以及基于空间数据转 换标准的间接转换。 空间数据的互操作针对异构的数据库和平台,实现数据处理的互操作, 与数据转换相比, 它是“动态”的数据共享,独立于平台,具有高度的抽象性,是空间数据共享的发展方向。 空间数据的互操作存在着多个层次,从最底层的面向硬件的互操作,到应用层次的信息 团体之间的语义共享。下表给出了互操作的层次以及其支持。 表 17-1:地理数据互操作以及其支持(陈述彭) 层次结构 支持 企业 信息 立法、政策、规范、标准 应用 语义 标准、语义数据模型、规程 地理信息系统 数据 数据库 DBMS、标准、规程 软件和网络协议 规程、协议、标准 技术 硬件和网络 标准等 2. ISO/TC211 地理信息标准 ISO/TC 211 地理信息/ 地球信息科学专业委员会成立于 1994 年 3 月,其目的是为了促进 全球地理信息资源的开发、利用和共享,即制定ISO/TC 211 地理信息/ 地球信息科学标准, 它是对与地球上位置直接或间接有关的物体或现象信息的结构化标准。该标准共分为 25 个 部分 * (截至 2000 年 5 月),主要针对地理信息的内容和相关的方法;各种数据管理的工具 和服务及有关的请求、处理、分析、获取、表达;以及在不同的用户、系统平台和位置上进 行数据的转换。 1)参考模型(Reference Model) 描述地理信息系统标准的使用环境、使用的基本原则和标准的改造框架,同时也定义了 该标准的所有的概念和要素。参考模型是一个独立于任何应用、方法和技术的模型,也是整 个 ISO/TC 211 的委员会的工作指南。 2)综述(Overview) 整个 ISO/TC 211 标准系列的介绍和回顾。ISO/TC 211 将是一个完整全面的地理信息系 统的标准族,该部分提供给潜在用户一个整体的标准系列和个别标准的综合介绍,包括标准 的目的、标准以及标准之间的关系等,使用户可以快速查询到所需要的内容,提高标准的可 理解性和可接收性。 3)概念化模式语言(Conceptual Schema Language) * 这 25 个部分主要由五个工作组负责。第一组,由美国召集,负责框架和参考模型,即 1-5,21,24 部分;第 二组,由澳大利亚召集,负责空间数据模型和算子,即 7、 8、 9 和 23 部分;第三组,由英国召集,负责地 理空间数据管理,即 10-15 部分;第四组,由挪威召集,负责地理空间数据服务,即 16-19,24 部分;第五 组,由加拿大召集,负责第 6,20 部分,第 22 部分由加拿大负责的另一个小组制定。其中后五个的部分的 工作刚刚开展。ISO/TC211 委员会同时有一个质量控制小组和咨询小组支持整个标准制定工作。 使用一种标准化的模式语言来促进互操作标准的开发,并提供一个快速建立地理信息标 准的基础。这种标准语言是在现有的标准概念化语言之上发展而成的。 4)术语定义(Terminology) 定义了所有 ISO/TC 211 标准中使用的专有词汇,其目的是产生通用的与地理信息标准 有关的词汇,供地理信息系统的标准制定者、使用者和开发者使用。 5)一致性和测试(Conformance and Testing) 为了保证所有 ISO/TC 211 标准的一致性而制定的测试框架、概念和方法。建立测试方 法的标准和保持一致性的原则可以使 GIS 软件的开发者来核实各类标准的一致性。 6)专用标准(Profiles) 定义所有 ISO/TC 211 标准的子集产品,它确定了在 ISO/TC 211 制定的全部标准的基础 上,针对某些具体应用提取出专用标准子集的方法和参考手册。 在 ISO/TC 211 中, 定义和描述了一系列地理信息以及地理数据管理和地理过程的标准。 其中,某个方面可能有多个标准,如测量标准和编码标准;其它一些标准可能描述了一系列 内容,如空间模式标准。在实际应用中,可能只采用某个标准或标准的一部分,甚至是对某 个标准进行特化,专用标准给出了使用的指导。 7)空间模式(Spatial Shema) 定义对象空间特征的概念模式,主要从几何体和拓扑关系的角度来制定概念模式。几何 体和拓扑关系是地理信息的两个主要特征,它们的标准制定将为其它空间特征标准制定提供 方便,同时可以帮助 GIS 开发者和使用者理解空间数据结构。 8)时间尺度子模式(Temporal Subshema) 定义空间实体时间尺度特征的概念,地理信息并不局限于三维尺度,许多地理信息系统 需要时间特征。 9)应用模式规则(Rules for Application Schema) 定义地理信息应用的模式,包括地理对象的分类和它们与应用模式之间关系的原则。采 用一致的形式定义应用模式,将增强应用之间数据共享能力,并且允许应用之间实时地交互 操作。 10)要素分类方法(Feature cataloguing methodology) 定义了对地理对象、属性和关系进行分类的方法论,并且确定建立一个国际化的多语言 的分类的可能性。地理信息的类别一般都决定于应用模式,提供一致的分类方法学增强了从 一个类别映射到另一个类别的可能性。 11)坐标空间参照系统(Spatial referencing by coordinates) 定义了坐标空间参照系统的概念化模式以及描述大地参照系统的指导,其中也包括一些 国际上使用的参考系统,制定坐标空间参照系统同样有助于各类应用之间的交流和数据共 享。 12)基于地理标识的间接参考系统 (Spatial referencing by geographic identifiers) 定义了间接的空间参照系统的概念化模式。 ISO 认为越来越多的有关地理信息的应用使 用非坐标类型的参照系统,即间接空间参照系统,例如地址数据,因而有必要产生一套间接 参考系统的标准模式。 13)质量原则(Quality principles) 定义了应用于地理数据的质量模式。对地理信息的创建者和使用者而言,质量信息都是 十分重要的。一致的质量标准模式,便于一个应用中创建的数据在另一个应用中被适当的评 估和使用。 14)质量评价过程(Quality Evaluation Procedures) 给出了对数据质量进行评估和描述方法的指导。关于地理数据质量的评价信息不仅需要 一致的标准,而且需要一个一致的、标准的评估和描述方法。一个标准的评估准则可以保证 不同数据集合的质量具有可比性。 15)元数据(Metadata) 定义地理信息和服务的描述性信息的标准。该标准制定的目的是为了产生一个地理元数 据的内容及有关标准。这些内容包括地理数据的现势性、精度、数据内容、属性内容、来源、 覆盖地区以及对各类应用的适应性如何等。对地理数据进行标准的描述可以使地理信息用户 方便地得到适用的数据。 16)空间信息定位服务(Positioning Service) 定义了定位系统的标准接口协议。全球定位系统的发展使得一个地理对象在全球范围内 的定位成为可能,定位信息标准接口的制定将促进这些定位信息在各类应用中更有效的使 用。 17)地理信息描述(Portrayal) 定义了地理信息描绘方法,不同应用系统之间采用一致的符号表现方法,将便于人们更 好的理解和识别各类地理信息。 18)编码(Encoding) 选择与地理信息使用的概念模式相匹配的编码规则,并且定义了概念模式语言之间以及 编码规则之间的映射方式。编码规则使得地理信息在以数字形式进行存储和传输时,按照一 定的编码语言和系统进行编码。 19)服务(Service) 识别和定义地理信息的服务接口以及与开放系统环境(Open System Environment) 模型之 间的关系。服务接口的定义有助于不同层次的各种应用访问和使用地理信息。 20)功能标准( Functional standards) 定义了地理信息科学领域已经识别出的功能标准的分类方法。功能标准的分类有利于 ISO/TC211 与其它标准的协调一致。标准子集的制定也与功能标准的识别有关。 21)图像和栅格数据( Imagery and gridded data) 为了使 ISO/TC211 能够处理地理信息场模型中的图像和栅格数据, ISO/TC211 需要定义 图像和栅格数据标准。它确定了其它组织以及 ISO 其它委员会定义的图像标准,这些标准 支持地理信息中栅格和矩阵数据标准的建立。由于地理信息中图像和栅格数据产品的增加, 需要该方面的标准的制定。 22)职员的资格认证(Qualifications and Certification of Personnel) 描述了地理信息科学/ 地球信息学中人员的资格认证体系,定义了地理信息科学/ 地球信 息学与其它相关学科以及专业的边界。详细说明了属于地理信息科学 /地球信息学领域的技 术。建立了该领域中技术人员、专业人员以及管理人员的能力范围和资格水平体系。 23)覆盖几何和功能的模式(Schema for coverage geometry and functions) 定义了描述覆盖的空间特征的标准概念模式。覆盖通常包括栅格数据、不规则三角网、 点覆盖和多边形覆盖。在大量地理信息应用领域中,覆盖是主要的数据结构,包括遥感、气 象、地形、土壤、植被等等。覆盖几何和功能的模式将有助于提高地理信息在这些领域内的 共享能力。 24)图像和栅格数据的成分( Imagery and gridded data components) 给出了描述和表现图像和栅格数据的概念标准,这包括针对图像和栅格数据的新的工 作:应用模式规则、质量原则、质量评价过程、空间参照系统、可视化和服务等,并表明的 新的工作与已有的针对矢量数据标准的不同之处。 25)简单要素的访问——SQL 选项(Simple feature access - SQL option) 该部分面向 SQL 环境的简单要素访问实现规范,该实现规范将支持要素的存储、检索、 查询和更新操作。 ISO TC211 标准的各个部分之间具有依赖关系。下表描述了这种依赖性。其中单元格内容为 "D"表示相应行的标准依赖于相应列的标准,如“质量评定过程”依赖于“质量原则”, "I" 表示有关,"X" 表示无关,"C"表示关系尚不明确。 表 17-2:ISO/TC 211 标准前 20 个部分之间的关系 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 1:参考模型 I I I X I I I I I X C I X I I I I I X 2:综述 D D D D D D D D D D D D D D D D D D D 3:概念化模式语言 D I I I I I X I I I I I I I I I I I I 4:术语定义 D D D D D D D D D D D D D D D D D D D 5:一致性和测试 D I X I D D D D D D C C D D I I I I D 6:专用标准 D I D C I D D D D D C C D D D I D D D 7:空间子模式 D I D I D I X D I I I I I I X I X I I 8:时间子模式 I I D I I X X C C X X I I X X I I X X 9:应用模式规则 D I D I X I D D D X C D X D X I I I D 10:地理信息分类 D I I I X X X I D X X C X D X X X X X 11:坐标参考系统 D I D I D I I X I X X C X X X X X X O 12:间接参考系统 D I D I I X I X X X I I X I X X X X X 13:质量原则 C I D I I X I I I I I I I I X X I X X 14:质量评定过程 D I D I X X I I I I I I D I X X X X X 15:元数据 D I D I I X D D C D D D D D I I D D D 16:定位服务 D I D I D X I I X X D X C X I X X D X 17:地理信息描述 D C D I D I D D D I X I I I D X X I X 18:编码 D I D I X I X X D D X X C X D I I I X 19:服务 D I D I D I I I I X I X X I D D I X D 20:功能标准 D I D I X C D D D X D D X X D X X X D 3.开放的地理数据互操作规范——OpenGIS OpenGIS(Open Geodata Interoperation Specification,OGIS-开放的地理数据互操作规范) 由 美国 OGC(OpenGIS 协会,OpenGIS Consortium) 提出。 OGC 是一个非赢利性组织,目的是 促进采用新的技术和商业方式来提高地理信息处理的互操作性(Interoperablity) , OGC 会员主 要包括 GIS 相关的计算机硬件和软件制造商(包括 ESRI, Intergraph,MapInfo 等知名 GIS 软 件开发商),数据生产商以及一些高等院校,政府部门等,其技术委员会负责具体标准的制 定工作。 OpenGIS 的目标是,制定一个规范,使得应用系统开发者可以在单一的环境和单一的工 作流中,使用分布于网上的任何地理数据和地理处理。它致力于消除地理信息应用(如地理 信息系统,遥感,土地信息系统,自动制图 /设施管理 (AM/FM)系统)之间以及地理应用与 其它信息技术应用之间的藩篱,建立一个无“边界”的、分布的、基于构件的地理数据互操 作环境,与传统的地理信息处理技术相比,基于该规范的 GIS 软件将具有很好的可扩展性、 可升级性、可移植性、开放性、互操作性和易用性。 OpenGIS 规范主要定义了以下三个模型: 1)开放的地理数据(Open Geodata) 模型: 定义了一个概括的、公用的基本地理信息类型集合,该集合可以被应用于特定领域的地 理数据建模。 OpenGIS 将现实世界抽象成为两类基本对象:要素(Feature )和覆盖(Coverage ), 前者描述现实世界中的实体对象,后者描述现实世界中的现象。对于要素,将与空间坐标相 关的属性抽取出来,称为几何体(Geometry) 。同时, OpenGIS 又定义了要素的时空参照系统、 语义(Semantics) 以及元数据来对要素进行描述,以便于共享和互操作。 2) OpenGIS 服务 定义了一个服务的集合,该集合用于访问地理数据模型中定义的地理类型,提供了同一 信息团体(Information Community )内不同用户之间,或者不同信息团体之间的地理数据共 享能力。 服务模型中的主要组成为: (2.1)要素实例(Feature Instance) 的创建过程 该过程用到了两个概念,要素模式(Feature Schema) 和要素注册(Feature Registry),前者 定义了要素的属性集,包括几何体、描述数据等;要素注册存放要素模式,所有的要使用和 共享的要素都要进行注册,要素注册起到了要素“工厂(Factory )”的作用,通过它可以创 建要素实例。 这种面向对象的要素实例创建过程便于实现数据的共享,同时又保证信息的封装性。 (2.2)获取地理数据的方法 在 OpenGIS 规范中,建立了一种树状的目录索引结构,其最小单元是要素,通过该目 录,可以得到所需要的地理数据。数据的获取在平台间是透明的,即可以跨平台访问数据。 (2.3)时空参照系统的获取和转换 在一个信息团体中是通过时空参照系来转换和解释几何体的, 时空参照系统必须能够按 照一种统一的标准来定义,并且通过某种机制能够使用这些定义。 OpenGIS 描述了注册时空 参照系统的机制以及在不同的时空参照系统之间进行地理要素转换的机制。 (2.4)语义转换 不同信息团体之间通过一个语义转换注册器来实现要素语义的转换,注册器包括源要素 和要素模式、目标要素和要素模式、以及要素转换器等,可以根据不同的要素转换要求查找 到匹配的转换器以进行语义转换。 3)信息团体模型 信息团体模型的目的是,建立一种途径,使得信息团体或用户维护对数据进行分类和共 享所遵循的定义;实现一种有效的、更为精确的方式,使不同信息团体之间可以共享数据, 尽管他们并不熟悉对方的地理要素定义。信息团体模型定义了一种转换模式,使得不同信息 团体的“地理要素辞典”可以自动“翻译”。 OpenGIS 规范包括抽象(Abstract )规范,实现( Implementation)规范以及具体领域 (Specific Domain )的互操作性问题,其中抽象规范是 OpenGIS 的基础,也是 OpenGIS 的 主体;实现规范定义了抽象规范在不同分布计算平台上的实现,目前 OGC 已经定义了针对 CORBA, OLE/COM 和 SQL 的简单要素访问的实现规范;针对领域的互操作性研究通过提 取领域的互操作性用例(Use case) ,检验抽象规范能否满足该领域的需求,它是抽象规范的 扩展。 抽象规范建立了一个概念模型,并将其文档化,采用了在面向对象技术中通用的 UML 作为其形式化的建模语言。抽象规范通过对现实世界的描述,建立了系统实现与现实世界之 间的概念化的联系,它是与具体的软件实现无关的,而只是定义了软件应该实现的内容。 目前,抽象规范共分为 17 个主题 * :(截至 2000 年 1 月) g108g32综述(Overview) g108g32要素几何体(Feature Geometry) g108g32空间参照系统(Spatial Reference Systems) g108g32位置几何体结构(Locational Geometry Structures) g108g32存储功能和插值(Stored Functions and Interpolation) * 这些主题类同于ISO/TC211 中的对应部分,并且一些概念,如“实体”、“覆盖”、“实体之间的关系”等, 在第二篇已经详细描述,在此不再赘述。 g108g32要素 (Features) g108g32覆盖类型及其子类型 (The Coverage Type and its Subtype) g108g32地球影象 (Earth Imagery Case) g108g32要素之间的关系 (Relations Between Features) g108g32质量 (Quality) g108g32要素集合 (Feature Collections) g108g32元数据 (Metadata) g108g32 OpenGIS 服务体系结构 (OpenGIS Service Architecture) g108g32目录服务 (Catalogs Service) g108g32语义和信息团体 (Semantics and Information Communities) g108g32图像使用服务 (Image Exploitation Service) g108g32图像坐标转换服务 (Image Coordinate Transformation Service) 抽象规范的十七个主题之间同样具有相互的依赖性,图 17-2 描述了这种依赖性。 要素几何体 元数据 要素集合 空间参照系 位置几何体 要素之间关系 要素功能和插值 语义和信息团体 质量 覆盖类型 地球影象 OpenGIS 服务体系结构 目录服务 图象使用服务 图象坐标转换服务 图 17-2: OpenGIS 抽象规范各个主题之间的依赖关系 [OGC] OpenGIS 的实 现需 要分 布计 算 平 台 (DCP-Distributed Computing Platform)的支持, 图 17-3 描述了 遵循 OpenGIS 规范 ,地理 信息 处理 在不 同 DCP“场 景” 中的 实现 。但 是 抽象规 范本 身与 DCP 无关,它可以在任何 DCP 上实现。 图 17-3:遵循 OpenGIS 规范,地理信息处理的在不同分布计算“场景”上实现 [OGC] 其它有关地理信息系统标准制定组织和标准 1) 美国 联邦 地理 数据 委员 会 (FGDC)制 定 的 美 国 空 间 数据元 数据 标准 和空 间数 据转换 标 准 FGDC 是美 国政 府机 构的一 个 协 调 性 组 织 , 其主要 目 的是在 全国 范围 内促 进对 地理数 据 的共同开发、使用、共享和传播。 空间数 据的 元数 据标 准定 义了一 套数 字化 地理 元数 据的内 容 , 并建 立了 相应 的概 念 和 术 语,根据该标准的定义,元数据可以从以下七个方面对空间数据进行描述: ( 1. 1)标 识 (Indentification):包 括数 据名 称, 开发 者,数 据描 述的 区域 ,专 题,现 势 性,对数据使用的限制等; ( 1. 2)数 据 质 量 (Data Quality): 数据质 量的 定义 , 数据精 度, 完整 性, 一致 性, 产生 该数据的原始数据以及处理过程; ( 1. 3) 空 间数 据组 织 (Spatial Data Organization): 数 字编码 的空 间数 据组 织方 式, 空间 实体的数目,除空间坐标外其他的属性; ( 1. 4)空 间 参 照 (Spatial Reference): 数 据采 用的 地图 投影, 存储 格式 ( 矢 量 还 是 栅格) , 水平与垂直的地球参照系,从一种坐标系统转换到另一种坐标系统的方法; ( 1. 5) 实 体和 属性 信息 (Entity & Attribute Information): 数 据中 包括 的地 理信 息, 信 息 的编码方式,编码的意义描述; ( 1. 6)分发 (Distribution):如何得到数据,数据的格式,存储介质,价格等等; ( 1. 7)元数据参考信息 (Metadata Reference):该数据何时完成,由谁完成等信息。 2)空 间数 据转 换标 准 (SDTS-Spatial Data Transfer Standard)是目 前美 国许 多政府 部 门 和 商业组 织所 采用 的交 换格 式标准 。 SDTS 是 一 个 分 层 的数据 转换 模型 , 定 义了 数据转 换的 概 念、逻辑和格式三个层次,同时采用元数据来辅助数据转换和评价。 概念层建立了地理要素及其特征的模型,可以是矢量数据也可以是栅格数据,提供了地 理要素的标准实体和属性的定义。逻辑层将概念化的地理要素转换成为逻辑化的模型、 记录、 数据项和子项,它提供了各种空间数据类型和关系的基础内容。 SDTS 的物理格式层定义了 与标准相符合的文件格式,以进行空间数据的转换。 SDTS 使得任意两种空间数据可以相互转换,并保证最小的信息损失,对于 NSDI(国 家空间数据基础设施)的实现起到了决定性的意义。 3)加拿大 Mercator GIS 标准 Mercator 是以墨卡托投影来命名的,它是由加拿大政府组织、建立的一个国家 GIS 数据 标准,其主要目标是:建立空间地理信息的标准,建立空间数据的存储库以及有关软件的开 发。 Mercator 定义了一个叫做 OGDI(Open Geospatial Datastore Interface)的程序接口,支持在 客户机/ 服务器模式下访问空间数据。 如果不用人动手,梭子就能够编制,拨子就能够弹奏里拉,工头就不需要仆人, 主人也不用指使奴隶了。 亚里士多德 第十八章 地理信息系统和社会 导读:地理信息系统应用的社会化是其发展的必然趋势,在社会化的GIS应用阶段, GIS技术在公众生活中被广泛使用,形成了GIS产业,这需要有相应的政策法规来 规范产业运行,并且需要教育为GIS应用提供专业人才。在GIS技术影响社会的同 时,一些社会因素也影响着GIS的发展。 1. GIS 的社会化 1. 1 实验室的 GIS 到社会化的 GIS 在地理信息系统发展的初期,只是一门被少数科研人员所掌握的技术,他们利用各种GIS 工具软件,甚至自己编写程序,处理空间数据,实现专业模型,得到服务于其研究工作的结 果;而大量的GIS学者主要进行算法和数据结构方面的研究。对于一般公众,地理信息系统 被认为艰涩难懂的,他们也无法意识到GIS技术可能的应用领域以及对社会生活带来的影响, 这时的地理信息系统称为实验室的GIS。 由于计算机计算技术的发展和应用的普及,特别是网络技术和数据库技术的成熟,许多 机构开始应用地理信息系统进行空间信息的管理,进而实现空间决策支持,以提高工作效率, 减少企业运行成本,这种GIS应用方式称为“企业化GIS”,企业化的GIS可以概括为以下8个 特点(陈子坦): 1)分布式的网络计算机环境: 基于网络的分布式计算使得企业各个部门可以共享资源, 包括数据、设备、软件等。 2)面向功能:为了满足各个部门对GIS的要求,企业化的GIS需要以提供各种功能服务 为主,保证各个部门按照其要求来使用。 3)连续无缝的空间数据库:为了达到对真实世界更有效、合理的管理,需要空间数据 在存储时按照真实世界的形式连续的存储,而不是分割成为不同的图幅。 4)数据的版本管理: 企业GIS在日常使用过程中,数据的变更是经常的,需要实施版本 控制以保证数据的有效性,并避免混乱。 5)不同层次数据和系统的共存:企业的任务是多个层次的,这要求同时使用不同的系 统和数据库。 6)与多个外部数据库相连。 7)开放式的系统环境: 开放式的环境使得一个企业化的GIS与其它领域能够紧密结合起 来,并且能够满足对系统进行扩展的需求。 8)全面的GIS系统管理的专业人员:企业化GIS对技术和管理人员有更高的要求,需要 企业不断地对人员进行技术和管理培训。 在企业化的GIS应用中,GIS学者主要研究领域包括,基于分布式计算平台上的GIS实现, 空间数据的共享和互操作,GIS项目管理等。 在企业 化GIS 应用 的初期 , 其应用 主要 集中于 一些 经 常要处 理和 使用空 间数 据 的部门 , 包括土 地, 市政 设施 管理 等等, 这些 部门 的业 务数 据具有 “强 ” 的 空间 分布 特性, 如地 块数 据, 管 网 数 据 等 , 采 用GIS 对其业 务进 行管 理是 “自 然” 的 需 求 。 随 着 信 息 技 术应用 的普 及, 许多其 他领 域的 机构 开始 采用GI S, 例如: 商 场 可 以 采 用GIS 来分 析不 同区 域客 户 的购物 倾向 ; 无线通信 部门 可以利 用GIS 来确定其 发射 台站的 覆盖 范围和覆 盖效 率;而 交通 部门可以 使用 GIS来分 析交通 流量 。在这 些机构中 ,空 间数据 只是 信息系统 中数 据的一 部分 ,或者信 息系 统的数 据, 如客 户、 雇员 数据, 具有 “弱 ” * 的空 间 分布特 性, GIS与其 它系 统 集成在 一起 , 服务于其业务。 在GIS 应用领 域拓 展的同 时 ,对空 间数 据的应 用层 次 也在提 高, 从简单 的数 据 管理到 复 杂的空间 决策 支持, GIS可 以满足各 种机 构不同 的功 能要求。 遥感 、GPS 技术发 展,为G IS提 供了新 的数 据来 源, 多源 的、 海量 的空 间数据 生成 并被应 用 。 上 述的变 化要 求实现 数据 的 共 享、 融 合 和 分 布 管理, 基于 网络的 分布 计算 平台 为之 提供了 技术 上的 基础 , 同 时GIS 标准 ( 包 括ISO/ TC211, OpenGIS等 ) 的 建 立 , 通 过 规 范 空 间 数据模 型、 空间 服务 模型 , 确 立 标 准 的 分 布计算 接口 , 保证了 数据 共享 、 融 合和 分布管 理的 实现 。 在 上述 的应用 发展 背景和 技术 发 展 背景下,GIS进入到社会化的应用阶段(图18-1) 。 传统的 GIS 应用领域拓展 应用层次提高 大量的各种 来源的数 据被 GIS 使用 GIS 标准化 GIS 相 关 产业的 形成与分化 GIS 政策、 法 规的制订 每个人都可以方 便的使用 GIS GIS 教育和认 证的普及 数据生产 软件生产 服务提供 工程监理 社会化 的 GIS 分布计算平台 图18- 1:地理信息系统的社会化 1. 2 GIS 社会化的影响 GIS的 社会化 有一 些其它 的 同义语 ,如 “全球 化” 、 “ 大众化 ”等 等,它 们实 际 上描述 了 GIS社会化的不同侧面。 “大众 化” 是GIS 社会 化的 主要方 面, 它是 指GIS 技术 已经融 入到 人们 的日 常生 活中, 迁 * “强”的空间分布特性是指数据的空间属性是所有属性中最重要的,也往往是数据使用者最关注的,如 地块数据;反之,则称为“弱”的空间分布特征,如雇员数据,对于企业管理而言,雇员的居住地点属性 显然不如工作技能,工资等属性重要。 移默化的改变着生活方式: g108g32将地图存储在计算机中,使以往利用地图提供的定位、定向、导航功能可以通过GIS 实现,而3S集成技术,可以使得定位导航功能更加自动化和精确; g108g32利用GIS可以将信息按照其空间坐标组织起来,进行查询检索;进而 g108g32可以分析其空间分布特点,进行决策支持。 汽车导航、野外探险和旅游、银行信用卡管理、商家经营分析、保险赔偿分析等等,人 们生活的各个方面,GIS都可以在其中发挥作用。当这种层次的应用从一个区域、一个国家 扩展到全世界,全球的空间信息都基于GIS技术进行管理时,就实现了“数字地球” ,可以认 为,“数字地球”是GIS应用的极致,也是GIS社会化的顶点。 公众在日常生活中使用着地理信息系统,可是他(她)不需要了解任何GIS的知识,换 言之,他(她)根本感觉不到GIS作为独立的技术在其中所起到的作用,正如一个基于数据 库建立的自动取款机系统,当人们在存款、取款时,不需要了解数据库的查询、修改、提交、 回送等具体功能的概念和实现,但确实,他用到了这些功能。这时,GIS应用和其他应用紧 密结合在一起,已经成为人们日常生产和生活不可分离的一部分,正如一些学者所预测的, “GIS发展的将来就是没有GIS”。 从应用角度来看,GIS的社会化意味着每个人都可以方便的使用GIS功能。而从应用开发 角度来看,GIS社会化的标志是GIS产业的形成与分化,形成专门的数据生产厂商,GIS平台/ 构件开发商,GIS集成商,GIS服务提供商以及GIS工程监理等等;相关GIS技术标准的确立, 对于GIS产业的发展提供了基础。地理信息系统产业的发展,需要大量的专业人才,推动了 GIS教育和认证的发展;此外需要政府和立法部门制订相应的政策法规,以保证产业运行的 有序性(图18-1)。 2. GIS 社会化的其它问题 2. 1 产业 随着GIS的社会化,地理信息已经发展成为一个巨大的产业,目前在美国,每年GIS应用 项目多达1万个,创造产值在10亿美元以上。在产业发展和壮大的同时,也在发生分化,产 生与地理信息相关的新的产业部门,产业的分化有利于形成规模经济,在整个社会范围内合 理分配人力和财力资源,具体包括: 2. 1. 1 数据生产 在GIS应用中,地理数据的生命周期较硬件和软件都要长,并且地理数据的生产需要大 量的时间,人力和资金的投入,有效生产和维护地理数据是地理信息系统社会化的前提。地 理数据库的建立方式,除了由国家组织建设基础空间数据外,由专门的数据生产厂商录入和 维护地理数据,并将之作为商品出售,可以提高数据的生产效率,避免数据的重复录入造成 的浪费,降低GIS应用开发的成本。作为商品的数据的发售形式可以是光盘,磁带等,在因 特网迅速发展的今天,通过网络发布数据的方式被越来越多地采用。 2. 1. 2 GIS 软件生产和系统集成 目前, 有许 多的公 司在 从 事GIS 软件的 开发 和系统 集 成业务 ,随 着软件 技术 的 发展, 特 别是软 件开 发过 程中 越来 越多的 采用 构件 技术 , 将 形 成GIS 软件 构件 生产, GIS软 件集成 , GIS 系统集成等多个部门(图18-2) 。 数据 硬件设 备 GIS 软 件构件生产 GIS 软 件组装 GIS 应 用系统集成 图18-2:GIS软件生产和系统集成过程中三个阶段的活动 GIS软 件构件 生产 是按照 公 共的构 件接 口规范 ,生 产G IS软件 构件 ;而GI S软件 组 装则根 据具体 的应 用需 求, 将构 件组装 成为 应用 软件 , 软 件的具 体形 态可 以是 多种 多样的 ; 而 应 用 系统集成则将组装完毕的软件与数据以及硬件设备集成,形成完整的GIS应用。 在传统 的GI S应 用阶 段, GIS软件 厂商 提供 了从 软件 生 产到系 统集 成的 各项 服务 , 甚 至 包 括数据的 录入 和维护 ;而 在社会化 的GIS 应用 中,这 三个阶段 活动 分别由 不同 厂商提供 ,这 样可以 提高 软件 生产 的效 率, 保证 软件 质量 , 最 重 要 的 , 组 装 生 成的软 件可 以方便 地与 其他 应用系统集成,满足用户的各种需求。 2. 1. 3 GIS 服务 一个组 织机 构要使 用GIS 功 能,除 了通 过开发 或者 购 买建立 自己 的应用 系统 之 外,还 可 以购买G IS服务 ,这 样就需 要有专门 的GIS 服务 提供者 。GIS服 务包括 的范 围很广 ,最简单 的 如对客户 提交 数据的 处理 和信息提 取, 此外, GIS技 术咨询, GIS认 证等 都可以 划归到G IS服 务的范 畴, 总之, 提供G IS服务的 目的 就是 为了 帮助 解决用 户在 建立 和使 用GI S的过程 中遇 到 的问题,减少不必要的损失。 2. 1. 4 GIS 工程监理 许多机 构在 建立GI S应用 , 是通过 项目 招标, 寻求 开 发商, 然后 双方签 定合 同 ,规定 项 目的具 体内 容, 进而 依据 合同, 开始 进行 系统 开发 。 在 项 目 开 发 过 程 中 , 开 发方所 依据 的是 用户的 需求 , 但 是由 于用 户方可 能对 具体 的技 术不 理解, 从而 无法 确定 项目 开发是 否在 按照 自己的 需求 进行 , 因 而也 就无法 对项 目的 进度 、 质 量进行 监控 , 如果到 项目 快要结 束时 才 发 现问题 , 会 严重 影响 项目 进度, 甚至 使项 目失 败。 为 了解决 上述 问题 , 一 般规 模较大 的项 目, 都需要 GIS工程 监理 ,监 理 方由GI S领 域方 面的 专家 组 成,他 们对 用户 负责 并了 解用户 需求 , 对项目的开发进行检查,可以及时发现问题,避免损失。 上面描述了在社会化的GIS应用阶段,所需要的GIS产业部门,随着应用的扩展和应用层 次的加深,也完全可能出现新的部门。 2. 2 政策 为了促进GIS应用的社会化,可以制订一些政策,提高GIS应用的广度和深度,此外,GIS 社会化过程中,也需要一系列的政策法规,规范GIS应用以及产业的运作。 2. 2. 1 GIS 标准和规范 GIS标准和规范的制订便于实现空间数据的共享和互操作,指导GIS应用的建立,从某种 意义上来讲,一个好的GIS标准是产业化的基础。标准的制订,既可以由一些标准化机构, 如ISO、OpenGIS、OMG等组织;也可以由政府主持制订,并作为一项政策,在全国范围内颁 布实施。通常,前者是指导性的,而后者具有一定的强制性。 除了制订GIS标准之外,一些政府性的GIS相关机构(如中国的测绘部门等)也可以参加 一些国际性标准化组织的标准制订工作,并将国际化的标准特化,以适应本国的具体情况。 2. 2. 2 基础空间数据的建立和共享 国家基础空间数据建立,是一项浩大的工程,无法由任何单位单独完成,必须由国家进 行组织,多个地方单位参加,协作完成。由于许多GIS应用是非赢利性的,这意味着项目组 织单位无法承担高昂的数据购买费用,而重新组织数据录入无疑又是对人力和时间的巨大浪 费,这种情况在一定程度上限制了GIS应用的发展。国家组织建立基础空间数据库,免费或 低价提供给一些非赢利组织使用,如市政管理部门、科研部门等等,可以降低建立GIS的成 本,有利于GIS应用的推广。空间数据标准是建立基础空间数据库的前提,另一方面,还需 要制订相应的政策保证数据的共享。 2. 2. 3 其它领域应用 GIS 的规定 社会化的GIS应用,意味着许多机构主动地采用并建立GIS应用,以提高管理效率,同时, 一些政策的制订,也有助于GIS技术被广泛接受,例如,可以规定一些城市规划的制订,自 然灾害保险的赔付,必须要有GIS分析的结果作为依据,这样,一方面使得决策更加科学, 另外可以加速GIS应用的发展。 2. 2. 4 GIS 产业的运行规范 随着GIS产业的发展和壮大,自然会出现与其他信息技术产业类似的问题,如不正当竞 争等,需要有相应的政策进行规范。规范的制订和实施可以参照IT产业其他部门,同时,由 于GIS在技术上特殊性,也往往需要GIS专家的参与。 2. 3 法律 计算机技术的迅速发展和广泛应用,为人类社会提供了一种全新的生活方式,同时也带 来了各种各样的,新的法律方面的问题,例如: 1)计算机犯罪 计算机犯罪指针对计算机系统的各种犯罪活动,如非法侵入计算机系统,盗窃或者非法 使用计算机系统的数据,制造病毒等等。这些活动,既包括蓄意的或者出于好奇的破坏性活 动,也包括利用计算机系统谋取非法利益的活动。 2)软件版权 随着信息技术产业的迅速发展,许多国家都认识到了计算机版权保护的重要性,并制定 了相应的版权保护法规,以保护软件作者的知识产权,并保证信息技术产业运行的有序性。 在信息技术领域,受到版权保护的对象包括程序、数据、文档、集成电路等等,不同的对象, 其具体保护内容和侵权认定也有所不同,并且由于技术的不断发展,要求版权法也要进行相 应的调整。软件(包括程序,数据和文档)由于其便于复制的特点,是版权保护的重点。 3)隐私权 计算机技术的发展和广泛运用对隐私权造成了较大的冲击,主要原因是通过计算机系统 提供的便利,可以方便地收集和使用个人资料。特别是因特网的发展,该问题变得更为突出, 因为用户在访问网站时,注册所填写的个人信息很有可能被非法使用。 4)网络法律问题 在计算机网络出现,特别因特网将全球网络连接成为一个整体以后,上述各个方面又发 生了新的变化,出现了新的问题,如:网络作品版权, BBS 的言论自由, WWW 的内容控 制,网络广告,网络病毒,网络上的不正当竞争,网络交易的安全性以及隐私权等等,这都 需要对原有法律进行修改,以适应这些变化。 作为信息系统中的重要成分,地理信息系统在应用过程中,同样会遇到类似的问题,这 些问题一般都可以适用普通的计算机法律条款,如 GIS 软件的版权等等。下面主要就地理 信息系统中使用的空间数据版权进行讨论,这是因为空间数据在 GIS 应用中占有非常重要 的位置,并且与通常的信息系统数据相比,空间数据有一定的特殊性。 美国是最早提出数据版权保护国家, 对于数据版权的保护,其版权法做出了如下的规定: 1)将他人的版权作品纳入一项编辑作品内,必须取得这些作品权利人的许可,否则将 构成侵权; 2)在纳入一项编辑作品之后,并不改变作品中各个组成部分原有的版权归属,编辑者 只是拥有该数据的整体版权。 3)收集并编辑一些事实信息或者本身无版权的资料形成的数据,是否成为编辑者的原 创作品,并由编辑者拥有版权,一般有两种观点,1 )“辛勤收集(Industrious Collection) ”原 则,即尽管信息是已经存在的,只要编辑者在收集数据,并进行编辑处理,成为计算机可以 检索形式的过程中,付出了经费、时间,使用了一定的技术手段,那么编辑者对其拥有版权; 2)强调数据选择和组织安排的创造性,认为只有在信息的选择和组织安排方面体现了创造 性的的数据才具有原创性。 上述的规定和原则,在处理一些数据版权纠纷时被经常采用,但是在一些具体的问题如 将数据库的一部分下载到自己的计算机中以及对有版权的数据重新组织等行为的侵权认定 还有待进一步的澄清。 国际上关于知识产权的伯尔尼公约( Berne Convention)的“文字和艺术作品”的定义 中, 明确规定了地图、 地形图、 与地理有关的三维作品 (Maps, Topography, Three Dimensional Works Relative to Geography)均属于知识产权保护的范围。各国在对 GIS 中的空间数据进行 保护时,通常都援引与地图版权保护的法律条文。与一般的数据相比, GIS 数据可以有多种 获得途径,包括纸质地图数字化,遥感图像解译,测量仪器以及现有数据的模型运算等都可 以生成新的空间数据,此外,在开发 GIS 应用时,也可以购买空间数据;数据的处理复杂 程度有很大的差别,既有简单的坐标变换,又有复杂的专业模型运算;数据的发布形式多样, 如硬拷贝、磁盘、光盘、磁带以及 Internet 上的电子发布;数据应用的目的各异,空间数据 可以应用于教学、科研、商业、公共服务、管理等各个领域。在进行版权保护时,需要综合 考虑上述因素。 1)数据的获取 (1.1)利用测量设备,包括 GPS、平板测图仪等,得到的空间数据,无疑是其制作 者(也包括数据制作单位)原创作品,作者对之拥有完全的版权; (1. 2)纸质地图数据的数字化,需要区分两种情况,即原地图是版权作品,及原地图 是无版权资料。对于前者,数字化时需要取得地图权利人的许可。地图的数字化是一项非常 繁重的工作,在数字化过程中,需要对原数据进行离散化和抽样处理,并且不同录入人员采 用不同的录入方法,得到数据的精度也不同,即数字化后的数据不能等同于原纸质地图。从 这个角度讲,数字地图的作者应该数据拥有完全的版权。 (1 . 3)数据购买只是获得数据的使用权,并没有得到所有权,购买数据的单位或个人 将数据再私下转让给其他单位或个人,就构成了对权利人版权的侵犯。这一原则和普通的软 件购买类似,软件购买可以通过许可授权做出更为明确的限制,而对于数据购买而言,购得 的数据能否安装在不同的计算机中;为一个项目购买的数据能否应用于另外一个项目;数据 使用许可能否象普通软件一样进行转让,尚需要进一步的探讨。 (1 . 4)遥感数据往往是通过购买得到,因而购买单位只是拥有使用权,但是对遥感数 据进行处理,并得到专题数据(如植被覆盖图,土地利用图等),该过程融入了处理者的思 想,所以一般来说,数据处理者拥有完全版权。 2)数据处理 只有在对有版权的电子数据进行处理,而处理者并不拥有其版权的情况下,才会涉及版 权问题。数据的处理需要处理者投入时间和经费,并且体现了处理者的思想,数据处理完成 后,原始数据在新的数据中并不显式地表现出来,根据“辛勤收集”和“创造性”的原则, 在一般情况下,可以认为处理者拥有完全的版权。 但是,数据处理过程的复杂程度是不一致的,对于一些简单的变换处理,如投影变换, 文件格式转换,图像处理中亮度、对比度变换,通常这些变换是可逆的,即由处理结果可以 再生成原始数据。因而,处理者不能拥有结果数据的版权,否则会造成对原始数据权利人的 侵权。在实际操作中,在简单处理和复杂处理之间进行绝对的区分是困难的,往往需要 GIS 专家的参与以进行判断。 3)数据的发布形式 空间数据可以有多种发布形式,包括地图,计算机可读的各种介质,Internet 等等,具 有版权的数据,无论其发布形式如何,其版权都应该受到保护, 除非权利人做出特别的声明。 4)数据应用目的 空间数据的使用可以有不同的目的,包括教育,科研,公共服务,商业等,一般对于非 赢利目的使用数据,其限制可以适当放宽。 在 GIS 日益社会化,并且空间数据收集、数字化和加工成为 GIS 产业中的重要组成部 分的条件下,制订针对空间数据版权保护的法规,对于保护数据生产商的利益,促进 GIS 应用的发展有重要的意义。 当然,随着 GIS 的社会化,带来的法律问题并不仅仅局限于数据版权,以下的一些问 题,如 GIS 产业的不正当竞争,空间数据的保密等等,都需要法律专家和 GIS 专家共同努 力,提出合理的解决方案。 2. 4 教育和评估认证 随着地理信息系统技术的发展,社会对GIS人才的需求也越来越大,同时,对于每一个 GIS职员,他(她)所需要的GIS知识的数量和复杂程度也在不断加大。因而,许多GIS从业 者在寻求进行培训和教育的机会。 目前,进行GIS培训和教育的机构主要包括职业学校、社区学院、大学和学院、GIS软件 开发商、使用GIS的单位等。 这些机构进行培训的主要方式包括[T.A.WIKLE]: 1)工作室培训和短期课程培训班 工作室培训和短期课程培训班是一种不太正式的培训方式,在GIS发展的初期,这种培 训方式占了很大的比例。工作室和短训班不需要特别的先决条件,通常讲述的是GIS软件。 在一些情况下,对所有参与者,或者通过考试者发一份认证材料。 其课程可以是一般性的,也可以是针对某个应用或者软件的,前者一般由大学举办,后 者则通常由GIS软件开发商组织(如ESRI的ArcView 4.0认证),此外,一个GIS应用机构在开 展新的项目时,需要对员工进行培训;他们在雇用员工时,也比较看重短训班认证,因为这 减少了他们培训工作量。 2)远程教学 远程教学是一种新的教学方式,它对于那些因为工作或者其它原因不能参加预定课程的 人员来说,是一个较好的选择。参加远程教学的学员需要学习一系列课程,以获得文凭,这 些课程的讲授资料可以通过视频信号或者因特网发送给远端的学员。 3)大学和学院的GIS课程 在GIS发展初期,由于昂贵的经费(软件,硬件,人员),很少有学校能够提供GIS教学, 近十几年来,由于微机的广泛使用以及软件厂商针对教学的商业软件打折销售,使得大学和 学院可以提供大量的、正式的GIS课程。到1996年,美国有600多所大学和学校开办至少一门 GIS课程,中国目前也有许多大学的地理系或测绘工程系成立了GIS专业,另外一些相关的学 科,如农学、土木工程、城市和区域规划、森林以及景观结构等也已经开始讲授GIS课程。 4)GIS认证 GIS认证一般需要学生已经完成了正规的GIS课程学习,在一些情况下,甚至需要获得GIS 学位。象正规的学位一样,认证需要一个严格的评估过程,并且要大学或学院的教员参与监 督。在一些情况下,研究院和公司合作,也可以进行GIS认证活动。 5)GIS学位 目前,特别是在加拿大和欧洲,许多学校已经开始授予地理信息系统和地球测绘 (Geomatics)学位,但是美国能够授予GIS学位的学校较少,有些学校是通过计算机和数学系 授予学士学位。 现在,中国的一些综合性大学(北京大学,南京大学)的地理系以及一些测绘专业大学 (武汉测绘科技大学)都能够授予GIS专业的学士、硕士以及博士学位。 北京大学城市与环境学系地理信息系统本科专业及课程介绍: 北京大学城市与环境学系地理信息系统本科专业成立于 1998 年,学制四年,授予理科或工 科学位,学生主要学习地理信息系统以及相关学科的理论、技术,使其能够在具体工作中应 用 GIS,掌握一定的 GIS 应用开发技能。学习的专业课程包括: 1. 地理信息系统原理 地理信息系统的基本概念、特征、作用与应用现状;地理信息系统的基本构成及空间数 据模型;地理信息系统应用的一般方法与流程;流行的地理信息系统软件介绍;地理信息系 统应用方法与实例。 2. 空间分析 介绍如何利建立空间数据库和图形数据库以及空间数据与图形数据的管理与组织, 在此 基础上,借助地理信息系统软件进行区域、环境以及社会经济等空间查询与分析。 3. 地理信息系统设计 深入介绍地理信息系统的空间数据结构、空间模型的建立与分析;空间算法;网络 GIS 以及 3S 一体化的基本原理与方法;GIS 软件的设计与开发。 4. 地理信息系统工程 介绍地理信息系统工程的概念;数据的采集方法、规范、质量控制及数据组织与管理方 法;地理信息系统二次开发技术;系统设计与开发的技术方案与流程;地理信息系统工程的 建设与人员管理;工程的经济与社会效益分析; 5. 遥感原理 遥感的物理基础;遥感平台;传感器简介;目视解译方法;在土地利用、森林、农业、 地貌、水文等方面的应用。 6. 遥感数字图像处理 介绍遥感数据的基本格式;遥感数字图像的几何校正、配准、变换等处理方法;人机交 互方式的遥感解译与遥感分类;遥感图像的空间分析。 7. 测量与地图学基础 测量学的基本原理; GPS 的基本原理与使用方法; GPS 数据格式以及接口简介;地图 与地图学的发展;制图符号;地图投影;标准分幅地形图的介绍;专题地图的信息表达;制 图综合;地图出版过程。 8. 数字地形模型 介绍地形模型的概念与原理;数字高程模型的建立;坡度、坡向、粗糙度、幅照度等的 计算方法;三维地形模拟;三维空间分析;在环境资源管理、土地利用、军事、地质地貌、 水文等领域的应用方法。 9. 计算机概论 计算机的基本原理;软件与硬件介绍;操作系统的使用;多媒体简介;网络与通信简介。 10. 程序设计语言 以 C 和 C++语言为例,介绍计算机程序设计的基本原理。 11. 数据结构 介绍数据结构的基本原理,一些基本数据结构(线性表,串,树,图)等介绍以及其相 关算法。 12. 数据库概论 介绍数据库的基本理论;数据库模型;关系数据库设计;数据库的运算与函数;数据库 的基本操作;数据库程序设计;SQL 语言;面向对象数据库,分布式数据库;远程数据访 问以及网络环境下的数据库系统开发与使用;数据库与地理信息系统的关系。 GIS应用的发展,需要大量的GIS专门人才,也需要大量GIS专业组织以提供各种服务, 除了教育之外,还需要相应的评估和认证体系来保障人才和服务的质量。 目前,GIS领域对专业人员的能力和品质的评定,是依赖于一种建立于组织以及个人之 间联系的“荣誉体系”。GIS应用的发展,需要一种更为结构化和客观的评估机制。其中,由 于可以通过歪曲结果等方式滥用GIS技术,对于非道德的行为最需要关注。 通常, 在GIS领域, 进行评估和认证的主要途径包括: 1)认证(Certification) 认证侧 重于 通过 考试 或者 其它等 价的 评估 过程 , 使GI S专业 人员 展示 其能 力和 对 GIS知 识 的掌握 程度 , 从 而得 到一 个精确 的、 可度 量的 结果 。 认 证 活 动 往 往 是 非 官 方 的 , 并 且需 要领 域相近的专业协会的监督,通过认证也往往需要特定的学习和工作经验。 2)许可证(Licensing) 许可证 也是 保证 GIS人员 能 力的一 个途 径, 它又 可以 称为注 册登 记, 是一 个强 制的过 程, 通过该 过程 政府 给予 一些 个人从 事某 些领 域的 许可 。 要获得 许可 , 申请 人必 须通 过一个 测试 , 并且可 能需 要完 成一 个认 证程序 或者 获得 学位 。 许 可证的 目的 是保 障公 众的 权利, 当个 人被 确认从 事了 非法 的或 者不 道德的 活动 , 其许可 证可 能被收 回 。 在 很多国 家 , 土地测 量员 需要 有许可证。 3)授权(Accreditation) 授权不 是针 对个人 ,而 是 对GIS 教育机 构的 认证过 程 ,包括 课程 ,教员 的数 量 和质量 , 设施等 等, 例如: 为了 保证 质量, 授权 过程 规定 了最 少的课 程数 目。 授权 通过 专业组 织进 行, 其目的是保证GIS教育的质量。 GIS教育、评估和 认证活动 ,使得地理信息系 统应用 组织能够得到足够 的,合 格的G IS 专业人 员 , 这 些活动 的进 行同样 需要 相应 的政 策、 法规的 支持 , 其中评 估和 认证过 程标 准 化 是其中重要的方面,ISO/TC 211标准系列第22主题定义了这方面的标准。 3.社会对 GIS 发展的影响 GIS 技术 既是 一个 工具, 可以解 决人 们在 生产 生活 中遇到 的各 种问 题; 同时 , 它 也 是 一 个社会 过程 ,即 GIS 技术 在影响 和改 变着 社会 的同 时,社 会也 对 GIS 技术的 发展施 加着 影 响。 任 何技术 的发展 都是一 个演 化的过 程,该 过程是 多种 可能的 发展路 径中的 一个 (图 18-3) ,在发展过程中,会遇到选择发展方向的各种状况,需要确定一个方向,而放弃另 一 个。通常影响决定因素包括:当时的实践、知识和社会条件等等。 A B 图 18-3: GIS 技术演化的图示 [E. Sheppard] 下面两个条件对地理信息系统技术的演化起到了最重要的作用 [E. Sheppard]: 1)首 先是 数字 计算 技术 , GIS 的发 展与 计算 机技 术 发展有 着密 切的 联系 ,这 意味着 计 算机技 术的 演化 路径 同样 影响着 GIS 的发 展, 例如 :基于 图灵 机逻 辑结 构的 数字计 算的 采 用以及高性能、小尺寸、低成本的微机的出现,对 GIS 的发展有着至关重要的影响。 2)其次 ,二 战以 后发展 的 一个重 要的 主题就 是, 各 个机构 能够 有效的 组织 和 管理生 产 以及有 效的 分发 货物 和服 务。 而 计 算 机 技 术 , 包 括 GIS 技术, 是实 现上 述目 标的主 要途 径, 而具体的需求目标,也从另一个角度影响着计算机技术。 除了上述的一般的影响因素,具体影响 GIS 发展的因素包括: 1)社会,特别是军事部门,对于全球定位的需求的紧迫程度; 2)私营企业主导 GIS 开发的程度; 3)潜在的客户希望采用 GIS 解决的问题和他们预期的付出; 4)影响数据可用性和成本的因素; 5)地理学不再视为理论性的学科,这样可以利用地理学对 GIS 的开发和应用进行评估。 当然,投资于 GIS 技术最根本的目的是其经济价值,如果 GIS 开发主要是由私营企业 进行的,这意味着 GIS 的发展是商业导向的,无论是开发数据产品还是平台系统,都需要 在商业上获利。 上述的因素,决定着地理信息系统的发展途径,形成了现在 GIS 软件以及应用的样式。 一旦选择了一条技术方案,就具有一定的惯性,对以后的 GIS 产生巨大的影响。例如, 基于层次结构的数据模型最早实现于哈佛图形实验室的软件 ODYSSEY,后来被 ESRI 的 ARC/INFO 所采用,成为 GIS 数据模型的主流技术方案,尽管面向对象的 GIS 很早就出现, 并且在技术上更为先进,但是并没有在市场上取得成功,也就是说 GIS 的发展并没有经历 这条途径。 球形的地代替了平面的地,引起了大地观念的依次彻底变化。这时人们无须扩展 大地的圆盘以远远超过有人烟的地区,而认为有人烟的地区只包括地球的一小部 分,更大的空余地面则可留待假说玄想去填充… … 阿尔夫雷德.赫特纳 第十九章 地球信息科学和数字地球 导读:本章介绍了GIS发展的一些最新的概念,包括地球信息科学,数字地球等等, 这些概念的具体含义至今仍在变化。 数字地球与其说是一门技术,不如说是一个政策,它是GIS应用发展的顶点。最后 介绍了国家空间数据基础设施,它是一个国家推广GIS应用重要的第一步。 1.地球信息科学 1. 1 几个相关概念 近十几年来,随着遥感,全球定位系统,地理信息系统以及计算机网络技术的发展,出 现了一系列新的、意义相近的、与地理信息系统相关的名词,如地理信息科学(Geographical Information Science) ,地球测量( Geomatics,地球信息学 [宫鹏 ],地球空间信息学 [李德仁] ), 地球信息学(Geo-Informatics ),地球信息科学( Geo-information Science)等等,这些概念 提出的时间还都不长,其含义存在交叉,目前国内对其确切的译名有些也存在着争论,下面 介绍地理信息科学,地球测量的概念以及地球信息科学的概念和内容。 1. 1. 1 地理信息科学 地理信息科学是 1992 年 Goodchild 提出的,与地理信息系统相比,它更加侧重于将地 理信息视作为一门科学,而不仅仅是一个技术实现,主要研究在应用计算机技术对地理信息 进行处理、存储、提取以及管理和分析过程中提出的一系列基本问题,包括: 1)分布式计算 2)地理信息的认知 3)地理信息的互操作 4)比例尺 5)空间信息基础设施的未来 6)地理数据的不确定性和基于 GIS 的分析 7)GIS 和社会 9)地理信息系统在环境中的空间分析 10)空间数据的获取和集成等等 地理信息科学在对于地理信息技术研究的同时,还指出了支撑地理信息技术发展的基础 理论研究的重要性。 1. 1. 2Geomatics Geomatics 被定义 为利 用各 种手段 ,通 过一 切途 径获 取和管 理在 空间 基础 信息 生产管 理 过程中 的空 间参 考数 据部 分的科 学与 技术 [Gagnon]。 Geomatics 还有其它 的 一些定 义, 这些 定义有不同的表述,但是其要旨基本上是一致的: 1)定义空间参考基础 2)建立和使用对空间参照物体和现象进行定位和量测的方法、技术和工具 3)整合不同参考系统中的数据 4)提供合格数据 5)运用计算机技术改善数据的处理、存储和发行 Geomatics 包括大 地测 量、 地籍测 量、 摄影 测量 与测 深等传 统测 绘领 域以 及遥 感和空 间 信息系 统等 新领 域 , 可 以 认 为是测 绘学 应现 代社 会对 空间信 息有 极大 需求 这一 特点提 出的 一 个更全面、更综合的学科体系。 1. 1. 3 地球信息科学 随着以 地理 信息 系统 技术 为核心 的遥 感 、 全 球 定 位 系 统等技 术的 发展 以及 其间 的相互 渗 透, 逐渐 形成 了 3S 集 成化技 术 系统, 为解 决区 域范围 更 广,复 杂性 更高 的现代 地 学 问 题 提 供了新 的分 析方 法和 技术 保证。 七十 年代 以来 , 由 于整个 人类 社会 面临 的人 口、 资 源 、 环 境 和发展 等各 方面 的问 题, 逐 渐开始 重视 全球 变化 ( Global Change) 以及 可持 续发 展 ( Sustanable Development)等方面的研究,这两个方面的推动,最终促成了地球信息科学的产生。 地球信 息科 学以 信息 流的 手段研 究地 球系 统内 部的 物质流 、 能量 流和 人流 的运 动状态 和 方式( 图 19-1) ,它由 三部 分组成 , “ 地 球 信 息 学 ” 是 其理论 研究 的主 体, “地 球 信息技 术” 是其研究手段, “全球变化和区域可持续发展”是其主要应用领域。 [陈述彭 ] 数据传 递 通讯网 络 信息加 工 目的 、计 划和 策略信 息产 生 信息传 递 地理信 息系 统 专业模 型、 专家 系统 因特网 传感器 信息获 取 地球数 据流 地球信 息流 策略信 息流 地球系 统 物质流 、能 量流 、人 流 人和工 程设 施 信息使 用 图 19-1:信息流和地球系统内部物质流、能量流和人流的关系 1. 2 地球信息科学的研究内容 地球信 息科 学的 本质 是从 信息流 的角 度来 揭示 地球 系统的 发生 、 发 展及 其演 化规律 , 从 而实现资源、环境和社会的宏观调控,作为其理论核心的地球信息机理研究包括: 1)地球信息的结构、性质、分类和表达; 2)地球圈层间信息传输机制、物理过程及其增益和衰减以及信息流的形成机理; 3)地球信息的空间认识及其不确定性与可预见性; 4)地球信息模拟物质流、能量流和人流相互作用关系的时空转换特征; 5)地球信息的获取和处理的应用基础理论等。 作为地球信息科学的研究手段,地球信息技术包括: 1)地球数据获取技术 用以从 外部 世界 获得 记录 地球性 质和 状态 的地 球数 据。 遥 感 、 全 球定 位系 统等 地球数 据 获取技 术的 发展 已经 形成 了覆盖 全球 的监 测运 行系 统, 建 立 起 多 层 次 、 立 体的 对地观 测系 统 ( EOS,Earth Observation System) ,是快速获取和更新地球数据的主要技术手段。 2)地球信息模拟技术 用于将 地球 数据 转化 为地 球信息 , 包 括地 球空 间信 息的加 工、 再生 以及 获得 有关某 一地 球空间问题解决的目的、计划和策略信息。 3)地球信息传播技术 用以实施空间数据的传递和信息的传播。 2.数字地球的产生背景以及其概念 数字地 球( The Digital Earth,DE)的 概念 最早 出现 于 1997 年下 半年 , 1998 年 戈 尔在一 次演讲 中将 数字 地球 正式 提了出 来 。 数 字 地 球 的 提 出 是建立 在人 类科 学技 术发 展成果 的基 础 上,有其深刻的社会、经济背景。 数字地 球的 科学 背景 , 包 括地理 信息 科学 , 地 球信 息科学 等一 系列 学科 , 这 些学科 的发 展, 为 数 字 地 球 的 产 生 打 下了理 论基 础; 对地 观测 系统以 及计 算机 网络 的发 展为数 字地 球提 供了技 术支 持; 全球 变化 和 可持续 发展 的研 究对 数字 地球的 出现 起到 了推 动作 用。 (图 19-2) 地理信 息系 统 遥感、 GPS 等 测绘技 术 地球信 息技 术 地理信 息科 学 Geomatics 地球信 息科 学 地球系 统科 学 数字地 球 全球变 化 可持续 发展 其它 学科理 论 技术支 撑 计算 机技 术 (网络 ,虚 拟 现实 …) 政策 应用 图 19-2:数字地球和其它理论以及技术的关系 数字地球的基本概念,可以归纳为以下三个方面: 1)数字 地球是 指数字 化的 三维显示 的虚 拟地球 ,或 指信息化 的地 球,包 括数 字化、 网 络化、智能化和可视化的地球技术系统; 2)实施 数字地 球计划 ,需 要有政府 、企 业和学 术界 的共同协 力参 加。实 施数 字地球 计 划是社会的行为,需要全社会的关心和支持; 3)数字 地球是 一次新 的技 术革命, 将改 变人类 的生 产和生活 方式 ,进一 步促 进科学 技 术的发展和推动社会经济的进步。 与地球 信息 科学 、地 理信 息科学 、 Geomatics 等一 系列学 科概 念以 及遥 感、 GPS、因 特 网等技 术名词 相比, 数字 地球更 象是一 项技术 政策 ,在一 定程度 上涵盖 了上 述的领 域, “更 加通俗 易懂 , 是一个 面向 社会的 号召 , 实质地 说 , 数字地 球就 是要 求地 球上 的信息 全部 实现 数字化” [陈述彭 ]。 数字地 球的 基础 技术, 由 遥感、 遥测、 地理信 息系 统、 因特 网等 组成, 遥感 、 遥测等 提 供获取 数据 的手 段, 地理 信息系 统进 行数 据的 管理 、 存 储 、 分 析 和 表现, 通过 因特网 实现 数 据的传输发布,这样构成了数字地球技术系统的基本框架(图 19-3) 。 Internet RS,GPS… WebGIS-DB 地学空 间数 据仓库 以及 交换站 计算机 仿真 、 虚拟现 实 OpenGIS 图 3:数字地球技术的基本框架示意图 数字地 球 : 展望 21 世纪我 们这颗 行星, 1998 年 1 月 31 日发表于 加利 福尼亚 科学中 心(艾 尔。戈尔) 技术创 新的 新浪 潮使 我们 能够大 量地 获得 、 存 储、 处 理和显 示关 于我 们行 星的 各种环 境 和文化 现象信 息。如 此大 量的信 息构成 了“地 理坐 标系” , 它涉及 地球 表面每 一个特 定的地 方。 利用卫 星对 地面遥 感形 成 “地球 空间” (轨 道)信 息 流,并 将其 中未经 加工 有 用部分 的 数据转 变成 为可 供使 用的 信息。 今天, 我们 经常 发现 我们能 够得 到比 我们 知道 要做些 什么 更 多的信 息。 地球 资源 技术 卫星能 够帮 助我 们更 好地 了解全 球的 环境 就是 一个 典型的 例子 。 地 球资源 技术 卫星 能够 每两 星期对 地表 进行 一次 完整 的成像 ,而 且它 已持 续收 集了 20 多年 。 尽管对 这类 信息 有着 巨大 的需求 , 但 大 多数图 像还 不能被 人们 使用 。 因 此 , 它们只 能被 存储 在电子 数据 库中 。 我 们过 去曾有 过这 样的 农业 政策 , 当 成 千 上 万 的 人 们 正 面 临饥饿 死亡 的时 候, 在 中 西 部 地 窖 里 却 存 储着大 量正 在霉 变的 粮食 。 我 们 现 在 一 方 面 表 现 出 对知识 的那 种贪 得无厌的饥饿,另一方面是大量数据目前仍然根本未被使用过。 问题之 一是 用什 么方 法把 信息显 示出 来 。 有 人 曾 经 说 我们是 否能 试用 计算 机术 语来描 述 人脑, 然而 , 人 脑看 起来 比特率 比计 算机 低, 但却 具有极 高的 分辨 率。 例如 , 研 究 表 明 由 于 人脑比 特率低 ,因此 ,很 难在短 时间记 住七条 以上 的数据 。但是 , 如 果这些 信息被 排列在 一个相互可以 被识别的模 型内如人类的 脸或银河星 系,人脑则能 够同时吸收 成千上万条 信 息。 过去我 们通 常利 用 Macintosh 和 Windows 操作 系统 提 供的桌 面图 形来 进行 ( 实 现 ) 人 机 对话的 ,事实 上,这 些工 具现在 已经不 适合新 的挑 战。我 相信我 们需要 一个 “数字 地球” , 一个多 种分 辩率 ,一 个三 维的表 述方 式, 使我 们能 嵌入巨 大数 量的 地理 坐标 系数据 。例 如 , 设想一位年轻孩子去本地的博物馆参观数字地球展览。在戴上显示头盔后,她看见地球从太 空中出现,使用数据手套放大电子图像;使用越来越高的分辨率,看见大陆,然后是乡村、 城市,最后是私人住房、树木和其他天然和人工的物质。她采用类似“魔毯骑乘”通过地形 的 3D 视图,眼前被发现的行星区域引起她探究的兴趣。当然,地形仅仅是她能与之相互作 用的多种数据之一。利用声音识别能力系统,她能够请求关于陆地覆盖、植物和动物的物种 分布、实时天气、道路、政治范围以及人口的信息。她也能使她和其它学生收集的作为全球 环境的一部分信息具体化。这些信息能被天衣无缝的融入数字地图或者地形数据。通过使用 数据手套单击一个连接按钮,她能够获得她所看见的事物的更详细的信息。例如,为全家去 黄石国家公园渡假作准备,她计划徒步去看天然喷泉,她刚刚阅读到关于野牛和洛矶山羊的 知识。事实上,在她离开故乡的博物馆之前她能够进行虚拟旅行。 她可以不受限制穿越空间,同样也能穿越时间。在进行虚拟地去巴黎参观卢浮宫的场景 旅游之后,她通过对时间地反向移动,学习法国的历史、细读被数字地球表面覆盖的数字化 地图、新闻短片、口述历史、报纸等主要的原始资料。她向自己的电子邮件信箱发送一些有 用的信息,以便今后学习。时间序列,从这里延伸到遥远的过去,能以天、年、世纪、甚至 是地质学的纪元,因为那些场合有利于她对恐龙的了解。 显然,没有一个政府、企业或学术界能单独从事这项工作。像全球性网络,它需要成千 上万的私人、公司、大学研究者以及政府组织的共同努力。虽然,作为数字地球的一些数据 是公共信息。但数字地球也可以成为公司销售大量商用图像和有偿信息服务的数字化市场。 它也可以变为一个“没有墙壁的实验室”,科学家可以在这里通过研究寻求理解人类和环境 之间复杂的、相互依存的关系。 创建数字地球需要的技术 虽然这些情节似乎有些像科幻学小说,但大多数建造数字化地球需要的技术和能力已在 这里或正在开发。当然,数字地球的能力将追随时间不断地进化。我们将有能力在 2005 年 对 2020 年的数字化地球进行一次原始的比较。下面一些技术是需要的: g108g32计算科学 直到计算机的出现,实验和理论两种创造知识的方法长期以来被限制,实验科学家对所 要进行研究的现象的观察太艰难,这些现象不是太小就是太大;不是太快就是太慢。它们存 在要么不到 10 亿分之一秒要么超过 10 亿年。另一方面,纯粹的理论不能预报像雷雨或飞机 上的空气流动那样复杂的自然现象。随着高速计算机作为新工具开始被使用,我们才能模拟 那些不容易观察到的现象,并且同时能更好地理解已经观察到的数据。按这种方法,计算的 科学允许我们突破实验和理论科学的局限性。模拟和仿真将给我们对我们正在收集关于我们 的行星的数据以新的洞察力。 g108g32大规模存储 数字化地球将要求存储 10 15 字节的信息。稍晚于今年,国家航天航空局的星球计划将每 天产生大量的有关地球的信息。幸运地是,我们继续在这个领域中制造戏剧性的改进。 g108g32卫星图像 早于 1998 年,政府已经许可提供分辨率图像处理服务的商业卫星系统开始运行这种服 务能使地图绘制达到足够的精确的水准,而在原先绘制地图的详细资料只能通过空中摄影来 获得。这种技术最先由美国情报组织开发,具有难以置信的精确性。当一家公司使用这种技 术,它象一架威力无比的摄象机,在它所摄的图片上可以清楚地看到从伦敦到巴黎象汽车前 灯的宽度大小的每一个物体。 g108g32宽带网络 数字地球所需的数据将由成千上万不同的组织维持,并非是单一的数据库。那意味在数 字化地球中正在使用的服务器将需要与高速的网络连接。由于 Internet 网上通讯量爆炸的驱 动,电讯营运者已经在试验每秒 10Gbps 的网络。10Gbps 网络技术是 Internet 的下一代的技 术目标之一。不好的消息是当我们绝大多数人的家中具有这类宽带之前,为什么数字化地球 建立在诸如儿童博物馆和科学博物馆那样的公共场所的接口是必须的。 g108g32互操作性 Internet 网和全球网之所以能够取得成功,关键在于达成统一的协议。如 Internet 协议。 数字地球也同样需要互操作性。这样,应用软件产生的地理信息就能被另一些人阅读。 GIS 产业界正在通过 GIS 协会寻找解决这些问题的途径。 g108g32 Metadata Metadata 是指“关于数据的数据”,了解信息的名称、位置、作者或来源、数据、数据 形式、分辨率等有助于建立其他的地理坐标信息系统。联邦地理数据委员会正在与产业界、 州和地方政府一起开发非官方的 Metadata 标准。 当然,需要更进一步的技术进步来充分认识数字地球的潜力,尤其是在这些领域如自动 解译图像、 对来自不同渠道的数据的整合以及能够从网上找到和连接关于地球上某个地点的 信息的情报机构等。 潜在的应用 全球地理信息系统的应用有时会被我们的想象力所限制。 我们可以通过目前使用的 GIS 和数据传感器来感受一下这些应用: g108g32虚拟外交 为了支持波斯尼亚的和平谈判;五角大楼开发出一种虚拟现实场景,它能使谈判代表作 一次虚拟的边界旅游。在谈判中,当塞尔维亚总统通过虚拟边界旅游看到原来的那条狭窄走 廊是不切实际的之后,同意在萨拉热窝和伊斯兰教戈拉日德被占领土之间提供一条宽阔的走 廊。 g108g32打击罪犯 加利福尼亚莎利纳市的警方已通过使用 GIS 跟踪犯罪模型和团伙活动来减少青少年持 枪暴力犯罪。通过收集关于犯罪活动的频率和分布的信息,使城市能够迅速重新部署警力。 g108g32保护生态多样性 在 Camp Pendelton 的规划机构称:加利福尼亚地区预测人口将由 1990 年的 110 万增加 至 2010 年的 160 万。这个地区被联邦或州政府立为被危害、威胁、或珍稀的而受保护的植 物和动物超过 200 种。通过收集关于地形、土壤类型、年度的降雨量、植物、陆地使用以及 所有权的信息,科学家模拟不同的地区增长计划对生态多样性产生影响。 g108g32预报气候变化 模拟气候变化最显著的未知因素之一是全球森林的递减率。新罕布什尔大学的研究者与 巴西的同事一起工作,通过卫星图像分析,能够监控亚马孙河流域的地形变化、这样他们就 能确定该流域森林递减率。这项技术现在正在被世界上其它森林地区采用。 g108g32增加农业的生产力 农民已经开始利用卫星图像和全球定位系统及时预防病虫害,并且把杀虫剂、化肥和水 用到最需要它门的那里去。这被称为精耕细作,或称“按英寸渐进的耕作”。 g108g32未来方向 我们有一个空前的机遇,来把有关我们社会和地球的大量原始数据转变为可理解的信 息。这些数据除了高分辨率的卫星图像、数字化地图,也包括经济、社会和人口方面的信息。 如果我们做得成功,将带来广阔的社会和商业效益,特别是在教育、 可持续发展的决策支持、 土地利用规划、农业以及危机管理等方面。数字地球计划将给予我们机会去对付人为的或是 自然界的种种灾害,——或者说能帮助我们在人类面临的长期的环境挑战面前通力合作。 数字地球提供一种机制,引导用户寻找地理信息,也可供生产者出版它。它的整个结构 包括以下几个方面,一个供浏览的用户界面,一个不同分辨率的三维地球;一个可以迅速充 实的联网的地理数据库以及多种可以融合并显示多源数据的机制。 把数字地球同万维网作一下比较是有建设性意义的( 事实上它可能依据万维网和因特网 的几个关键标准来建立) 。数字地球也会象万维网一样,随着技术的进步以及可提供的信息 的增加而不断改进。它不是由一个单独的机构来掌握,而是由公共信息查询、商业产品和成 千上万不同机构提供的服务组成。就象万维网的关键是互操作一样,对于数字地球,至关重 要的能力是找出并显示不同格式下的各种数据。 我相信数字地球的开发,首先需要建立一个由政府、企业和学术界共同参与的“试验田”。 这块“试验田”将成为一些应用诸如教育、环境、解决与互操作性相关的技术问题、协作能 力的联合以及解决一些政策问题如隐私权问题等的汇聚之地。当“试验田”获得成功并推广 时,在更广泛的范围内可以通过接入高速网络与数字地球进行相互作用。而进入 Internet 将 会感受到更多的限制。 可以肯定,数字地球不是一夜之间产生的。在第一阶段,我们应该把重点放在整合我们 已有的、来自不同渠道的数据。我们同样应该把引导儿童的博物馆和科学博物馆连接到高速 网络上如新一代的 Internet 网,这样我们的孩子就能够探索我们的星球。其次,我们应该努 力去开发一张一米分辨率的数字世界地图。最终,我们应该使有关我们行星与我们历史的大 量信息集聚到我们手指尖。 在数月前,我曾计划鼓励政府、企业、学术界和非赢利组织的专家们,制定一种实现这 种前景的策略。共同努力,就能有助于我们解决社会所面临的许多最紧迫的问题;鼓励我们 的孩子更多地了解他们身边的世界,并促进几十亿美元的工业经济增长。 3.数字地球核心技术综述 为了解决数字地球中的数字化、信息化以及应用问题,需要研究以下关键技术:科学计 算、海量存储、宽带网、卫星数据获取、元数据、互操作等等[ 戈尔] 。下面对这些相关关键 技术进行简单的描述。 1) 高分辨率卫星遥感数据的快速获取技术 卫星遥感是数字地球获取数据的主要手段,包括不同高度、 不同分辨率的陆地卫星系列、 海洋卫星系列、气象卫星系列以及小卫星系列,其分辨率从 1 米到 4000 米。遥感数据的处 理包括辐射纠正、几何纠正、增强、特征提取、自动分类、自动成图、数据压缩等等,高分 辨率卫星每天都要产生大量的数据,对这些数据的自动的、快速的处理以实时、准确地提取 信息是实现数字地球信息获取的关键。 2) 地球空间数据的存储和处理 为了能够将地球上的信息进行数字化,除了要存储和处理大量的遥感数据之外,还包括 图形数据,属性数据等等。实现对这些数据的查询检索,需要海量数据存储管理以及快速处 理技术。目前分布式数据存储是海量数据管理的趋势,可以避免集中式系统带来的管理困难 以及网络拥塞;而通常采用超大型计算机或者并行计算以实现快速处理。 3) 超媒体空间信息系统 数字地球的主要任务之一是通过因特网实现信息的共享和发布,主要通过 WebGIS 技术 实现。此外,数字地球应用中包含大量多媒体数据,也需要在因特网上发布,形成超媒体空 间信息系统。大量的数据在网络上传输,造成网络拥塞,这需要高带宽网络解决该问题。 4) 地理信息的分布式计算 地理信息的特征是分布的,并且具有基础性、共享性和综合性,分布式计算可以使得地 理信息应用于社会各个领域。遵循 OpenGIS 规范,基于 CORBA(或 COM)体系结构,实 现地理信息信息的分布计算,是其解决方案之一。地理信息的分布计算服务包括: (4.1)地理信息的共享领域服务 为社会各个领域的应用提供地理信息服务,提供共享和集成的基础。 (4.2)空间查询服务 包括通过元数据实现信息检索,属性、几何、空间关系等各个方面的查询。 (4.3)空间分析服务 实现空间信息提取,地理特征分析,图像理解,图像开发等服务。 (4.4)空间制图服务 包括空间坐标转换服务,地理注记服务,图像处理服务,特征综合服务,创建影象地图 服务等等,其目的是为了直观的表现空间信息。 (4.5)地理信息的特定任务服务 为地理信息领域特定用户提供有针对性的服务,主要为地理信息的获取、地理信息的建 立和维护服务,称为地理数据的管理服务。包括地理信息生产,地理信息生产管理,地图符 号管理,信息开发利用和分析,订购和跟踪,信息存储和检索系统,信息交付,信息再现和 复制,用户支持。 5) 无比例尺数据库 无比例尺数据库是指以一个大比例尺数据库为基础数据源,在一定区域内空间对象的信 息量随比例尺变化自动增减,即可以由大比例尺空间数据自动生成较小比例尺的数据。无比 例尺数据库的技术关键是自动制图综合,在该领域目前已有许多研究,但是都难以达到令人 满意效果。 6) 空间数据仓库 空间数据仓库是指支持管理和决策过程的、面向主题的、集成的和随时间变化的、持久 的和具有空间坐标的地理数据的集合。数据仓库的主要任务是将来源、结构、格式不同的原 始数据,首先对其进行标准化、过滤与匹配、精化、标明时间戳和确认数据质量的处理,即 求精过程;然后再根据任务的需要,进行数据的集成与分割、概括与聚集、预测与推导、翻 译与格式化、转换与再映象处理;最后进行数据仓库的建模、概括、聚集、调整与确认及建 立结构化查询等等。空间数据仓库的目的,是为了处理积累的海量空间数据,抽取有用信息, 并提供决策支持。其结构框架包括:数据源, Metadata 数据源, Metadata 互操作协议,数据 抽取求精,Metadata 创建与浏览数据仓库,存取与检索,Metadata 管理及查询与分析等。 7) 空间数据融合(Fusion) 空间数据融合是指多种数据合成后, 不再保存原来的数据,而产生了一种新的综合数据, 如假彩色合成影象。数字地球的多种数据融合,包括多种分辨率数据,多维数据以及不同类 型数据的融合,并且需要将融合得到的数据进行可视化表现,通常是将数据叠加在数字高程 模型上,形成三维立体景观影象。实现数字地球中的空间数据融合,需要地理数据互操作以 及高速网络的支持。 8) 虚拟现实(VR,Virtual Reality) 技术 虚拟现实技术,是指运用计算机技术生成一个逼真的,具有视觉、听觉、触觉等效果的 可交互、动态的“世界”,人们可以对该虚拟世界中的虚拟实体进行操纵和考察,用户与虚 拟现实系统的交互利用数据手套、数据头盔、数据衣等进行,而 VR 系统通过视觉描绘器, 听觉描绘器,触觉描绘器使用户产生身临其境的感觉。在数字地球中采用虚拟现实技术,可 以非常真实地表达现实地理区域,而用户可以在所选择的地理带内和外自由移动。目前, GIS、虚拟现实以及 Web 技术相结合的方式之一是 VRML(Virtual Reality Modeling Language, 虚拟现实造型语言) ,通过用 VRML 描述 GIS 信息,可以在因特网上发布空间三维数据供 用户浏览。 9) 元数据(Metadata ) 在创建数字地球的过程中,全球范围内对数字地理信息的需求越来越大,许多单位和个 人开始生产、处理和修改地理数据;另外,在计算机信息系统中,在采用模型对地理实体进 行研究时,为了保证信息不被误用,需要通过 Metadata 对数据进行详细的描述,这样不仅 数据生产者能够充分描述数据集,用户也可以估计数据集对其应用目的的适用性。所以,随 着地理空间数据生产者和使用者的增加,使用 Metadata 来描述数据,将成为一个必然的趋 势。 综上所述,数字地球技术的关键是实现海量数据获取、存储管理、处理和信息提取、信 息共享以及信息表达,下面给出了它们与上述具体技术的关系(表 19-1)。 表 19-1:数字地球技术概括 海量数据 获取 存储 管理 处理和 信息提取 信息 共享 信息 表达 高分辨率卫星遥感 g52 地球空间数据的存储和处理 g52 g52 超媒体空间信息系统 g52 g52 地理信息的分布式计算 g52 g52 g52 无比例尺数据库 g52 g52 g52 空间数据仓库 g52 g52 空间数据融合 g52 g52 虚拟现实技术 g52 元数据 g52 g52 g52 g52 说明:“ g52”表示该具体技术支持相应的实现目的。 4.国家信息基础设施和国家空间数据基础设施 正如前面所描述的,数字地球作为一项技术政策,其建立必须要有政府的参与,除了组 织和支持相关技术领域的研究之外,最重要的方面就是建设国家信息基础设施( NII,National Information Infrastructure )以及国家空间数据基础设施 (NSDI,National Spatial Data Infrastructure)。 4. 1 国家信息基础设施 国家信息基础设施是一个能够给用户随时提供大容量信息的,由通信网络、计算机、数 据库以及日用电子产品组成的完备的网络系统。目前全球被广泛采用的信息基础设施就是因 特网,而 Web 服务无疑是因特网上最重要的应用。国家信息基础设施将促进经济的发展, 其预期效益如下: 1)推动新技术发展,如半导体、高速网络及其软件; 2)形成大型产业,加速经济发展; 3)促进电子商务的发展; 4)协助解决医疗保健问题,降低医疗费用; 5)促进科技研究; 6)促进教育事业; 7)为全国公民服务。 4. 2 国家空间数据基础设施 国家空间数据基础设施(NSDI )是国家信息基础设施之后的又一个国家级信息基础设施, 其目的是为了协调基础地理空间数据集的收集、管理、分发和共享的基础设施。空间数据基 础设施主要由四个部分组成:数据交互网络体系、基础数据集、法规与标准、机构体系。从 技术的角度来看,其内容主要有:空间数据标准,基础空间框架数据,空间数据交换网络以 及元数据等等。 根据计算,目前全世界的数据中,有 80%的数据包括空间参考数据内容,也就是说, 地理信息已经渗透到各个部门和学科。许多组织和单位都需要利用空间数据进行业务生产或 科学研究,这样,确立数据标准,依据相应的制度和法规,指导空间数据的录入和管理,以 实现数据共享,可以进一步推动地理信息的使用,使地理信息应用单位不需要重复录入空间 数据,减少其工作成本,这是建设国家空间数据基础设施所带来的最大裨益。另一方面,数 字地球的建设是高技术难度,需要大量资金投入的工程,而国家空间数据基础设施可以视为 一个国家数字地球工程重要的第一步,因为它构造了空间数据库,确立了相应的政策、法规 和标准,这也是数字地球的实现框架中所必需的。 目前,我国 NSDI 的建设包括空间信息的收集、管理、协调和分发的体系和机构;空间 数据收集系统;地理空间数据集 Metadata 和空间信息交换网络;基础空间框架数据以及地 理空间数据标准。 1)空间信息的收集、管理、协调和分发的体系和机构:制订国家空间信息设施的规划、政 策、标准和法规,建立层次化的机构体系,协调各个部门(包括测绘、土地、环境、开 发、农业等部门)的协作和权益,研究相关技术,进行项目管理等等。 2)空间数据收集系统:包括一系列遥感卫星或小卫星组成的遥感卫星体系。 3)地理空间数据集 Metadata 和空间信息交换网络:包括国家基础地理信息中心,中国科学 院,国家信息中心,北京大学等许多单位已经开展了 Metadata 标准方面的研究,但是还 需同国际上相关工作的接轨。空间信息交换网络主要利用了国家信息基础设施,包括中 国公用分组交换数据网( CHINANET),中国互连网,金桥网( CHINAGBN),教育科研 网等。 4)基础空间框架数据:国家测绘局进行了基础空间框架数据的输入和建库工作,其中包括 全国 1:25 万地形数据库、 全国 1:25 万地名数据库、 全国 1:25 万数字高程模型、全国 1:100 万地形数据库、全国 1:100 万地名数据库、全国 1:100 万数字高程模型库、全国 1:400 万 地形数据库、全国 1:400 万重力数据库、部分地区 1:5 万 4D 产品系列、 全国七大江河 1:1 万 4D 产品系列等等。 5)地理空间数据标准:国家测绘局以及其它相关部门建立一系列空间信息标准,并已经发 布实施,包括“地理格网”,“国土基础信息数据分类与代码”,“林业资源数据分类和代 码”,“全国河流名称代码”等等。此外包括涉及空间数据交换格式,椭球体和投影等各 个方面的标准也正在制订之中。 附录一 GIS 的计算机基础 导读:本章讲述了掌握GIS功能所需要的计算机基础知识,包括: 1)计算机组成原理:简单概述了计算机的发展历史,介绍了计算机的硬件组成,重 点是各种输入/输出设备,这是GIS数据录入和制图输出所必需的,此外,虚拟现实 设备——包括数字手套、头盔显示器的介绍将有助于理解数字地球部分的虚拟现实 技术。 2)数据库知识:介绍了数据库,数据库管理系统的基本概念以及层次、网状、关系 三种数据模型,并针对关系数据库讲述了其基本操作和SQL。 3)数据结构和算法:介绍了数据结构的基本概念,以及对于GIS软件实现非常重 要的两种数据结构——树和图,最后给出了算法的定义以及算法效率的衡量指标, 可以作为GIS算法设计的指导。 1.计算机组成原理 1.1 计算机发展历史和展望 电子计算机的发展应该追溯到第二次世界大战期间,由于当时急需高速、精确的工具来 解决弹道计算问题,1943年4月,宾夕法尼亚大学摩尔电工学院开始试制一台被称为 ENIAC (Electronic Numerical Integrator and Computer )的电子数字计算机,并于1946年2月15日 制造出了这台机器。1946年6月诺伊曼(Neumann)等发表了一份《关于电子计算装置逻辑 结构初探》的报告,这份报告,提出了以二进制和程序存储控制为核心的通用电子数字计算 机体系结构原理,奠定了电子数字计算机体系结构的基础, 从此翻开了计算机发展的新篇章。 在电子计算机问世后,它所采用的基本电子元器件已经经历了电子管——晶体管——集 成电路——大规模集成电路四个发展阶段,通常称为计算机的四代(图 A1-1)。 1)电子管计算机时代,从 1946 年到 1958 年左右。这代计算机因采用电子管而体积大, 耗电多,运算速度低,存贮容量小,可靠性差。虽然这个时期的计算机原始而笨重,但却确 立了计算机发展的技术基础,例如,二进制、自动计算及程序设计等。 2)晶体管计算机时代,约为 1958~1964 年。这代计算机比第一代计算机的性能提高了 数十倍。软件配置开始出现,一些高级程序设计语言相继问世,外围设备配置也由几种增加 到十几种。除科学计算外,开始了数据处理和工业控制等方面的应用。 3)集成电路( IC,Integrated Circuit)计算机时代,约从 1964 年到 1970 年。这代计算机 主要由中、小规模集成电路组成。这种电路器件是在一块几平方毫米的芯片上集成了几十个 到几百个电子元件,使计算机的体积和耗电有了显著减小;而计算速度和存贮容量有较大提 高,可靠性也大大提高,计算机软件配置进一步完善;有了操作系统,系统结构方面有了很 大的改进。计算机机种多样化、系列化,并和通讯技术结合起来,使计算机应用进入许多科 学技术领域。 4)大规模集成( LSI,Large Scale Integration)电路计算机时代,从 70 年代开始到现在。 大规模集成电路是在一块几平方毫米的半导体芯片上集成上千个到十万个电子元件, 使得计 算机体积更小,耗电更少,运算速度提高到每秒几百万次。计算机可靠性也进一步提高。 七 十 年 代 初 , 出 现了 微处理 器。 它是 把计 算机 的运算 器、 控制 器制 作在 一片大 规 模 集 成 电路芯 片上 , 从 而 可 以 把 处 理器和 半导 体存 贮器 芯片 以及外 围接 口电 路芯 片等 组装在 一起 构 成 微 型 计 算机。 微型 机体积 小, 价格 便宜, 灵活 性大 , 使 得计 算机 应用 迅速发 展, 开始 了个 人用计算机的时代。 目前,计算机技术正在继续向巨型、微型、网络和人工智能等几个方向发展: 1)为满足尖端科学研究的需要,还必须发展高速、大存贮容量和强功能的巨型机; 2)计算 机另一 个发展 方向 是要研制 价格 低廉、 使用 灵活方便 的微 型机, 以适 应各种 应 用领域。 3)计算 机网络 是计算 机的 又一发展 方向 ,计算 机网 络提高了 计算 机系统 资源 ,特别 是 信息资 源的 综合 利用 , 把 分布在 许多 地区 的计 算机 系统 , 特 别是 分布 在各 地 的信息 资源 联结 在一起,组成一个规模更大、功能更强、可靠性更高的信息综合处理系统。 4)美国 、日本 等国正 在研 制第五代 “智 能”计 算机 ,它不是 注重 数学运 算, 而是注 重 于逻辑推理或模拟人的“智能” 。 图 A1-1:计算工具的发展概况 1.2 计算机的基本组成 按照诺伊 曼理论建 立起来 的当代计 算机,应 当具有 输入/输出 功能、存 储记忆 功能、 计 算功能 、 判 断功 能和 自我 管理功 能。 从功 能模 拟的 角度, Neumann计算 机通 常 由与上 述功 能 对应的功能 部件组 成, 这些部件主 要包括 输入 /输出设备、 存储器 和 中央处理单 元 (CPU,Central Processing Unit) 。它们之间的关系如图 A1-2所示。 图 A1-2:计算机组成框图 1)输入/输出(I/O)设备 输入输 出设 备是 接收 外部 信息 ( 如 输 入 原 始 数 据 和 程序) 或用 来向 外部 输出 信息 ( 如 计 算 结 果 ) 的 功能 部件 , 包 括 打 印机、 显示 器、 键盘、 磁带 机、 扫描 仪、 鼠标器 、 光 笔、 触摸 屏、条形码阅读器等。 2)中央处理单元(CPU,Central Processing Unit) CPU是计算机的核心,它主要由运算部件、控制器、寄存器组所组成: (2.l)控制器 控制器的主要功能是按时钟提供的统一节拍,把程序中每一条指令所含的各基本操作进 行时序分配,并发出相应的控制信号,驱动各部件按照节拍有秩序地完成程序规定的操作内 容。 (2.2)运算部件(ALU) 运算部件是直接进行数据变换与运算的部件。运算部件主要由逻辑电路构成的加法器组 成。加法与逻辑运算是运算器最基本的操作,由它们可以进一步实现四则运算(加、减、乘、 除)和逻辑操作(逻辑运算、条件运算等)。 (2.3)寄存器组 运算部件进行计算需要输入两个操作数,并产生两个输出:结果和运算特征。运算特征 也称运算状态,如操作结果是否为零、是正还是负、有无进位、操作是加还是减等等,取得 这些操作特征的目的是为了决定下一步的操作。 3)存储器 存储器是计算机的记忆装置,用以保存程序、原始数据以及中间结果。目前,计算机基 本上采用线性地址存取方式。每一个地址对应一个存储单元,存储单元可以按位(bit)或 按字节(8bit)、字(16bit)、半字(8bit)、双字(32bit)等编址。在按字节编址的情况 下,每个存储单元存储一个字节(1Byte)信息。 存储器中存储单元的数量称为该存储器的容量,它是评价计算机功能的重要指标之一。 存储器容量愈大,所能存储的信息就越多,可处理的问题的复杂度就越高。容量、价格、存 取速度是评价计算机存储器的三大指标。但三者之间又互相制约: 容量大, 存取速度就要低; 采用存取速度高的元件,成本就高;成本高,就不允许做得容量太大。为此,通常采用分级 存储方式来解决这三者之间的矛盾。最基本的分级存储结构是两级存储,即把存储器分为主 (内)存储器与辅助(外)存储器两级。主存储器采用半导体存储器,辅助存储器采用磁介 质存储器。磁盘就是广泛使用的一种辅助存储器。为了进一步提高计算机的性能,在主存和 CPU之间又增加一级比主存速度更高的高速缓冲存储器Cache,形成三级存储体系。 1.3 存储系统 早期的诺伊曼计算机是以运算器为中心的,系统内各部件间的信息传送都要经过运算 器。随着计算机应用的深入和外部设备的发展,内存与外存等外部设备之间的信息交换日益 频繁,为适应这一情况,形成以存储器为中心的系统结构,主存同外部设备之间的信息交换 不再通过运算器。共享主存的多处理机的出现,更加强了存储器作为计算机系统的中心地位。 这时,存储器除了要向一台或多台高速运行的CPU提供所需的指令和数据外,还要同并行工 作的外存及其它外设和终端等设备交换信息。存储系统的特性,已经成为影响整个系统最大 吞吐量的决定性因素。 广义地讲,在一定条件下,物质性质的改变,就是对过程条件的记忆,如果这些物理性 质可检测并且与其相应过程条件之间有确定的一一对应关系,则可用做记忆元件。基于二进 制逻辑的电子计算机所要求的记忆元件应当有两个明确定义的物理状态,以分别表示两个逻 辑值,并且这两个状态可以被检测并转换成电信号。信息的存取速度取决于测量与改变元件 的记忆状态所需的时间,能满足这一要求的物质有机械的、磁的、电子的、光学的、化学的 和生物的等等。 1.3.1主存储器组成 目前,主存储器中所使用的记忆元件是电子的,即半导体的,包括: 1)半导体RAM(Random Access Memory)记忆元件 随机存取存储器RAM要求能随机地对存储器中的任何单元进行存取, 且与存取的时间和 该单元的物理位置无关。具体地说,它要求元件有如下记忆特性。 g108g32有两种稳定状态; g108g32在外部信号的激励下,两种稳定状态能进行无限次相互转换; g108g32在外部信号激励下,能读出两种稳定状态; g108g32可靠地存储。 2)半导体ROM(Read Only Memory)记忆元件 ROM 是一种在机器运行过程中只能读出、不能写入信息的无源存储器,是一种非易失性 器件。它所存储的信息是用特殊方式写入的,主要用于存储器经常要用的一些固定信息。 3)闪速存储器(Flash memory) 1.3.2辅助存储器 辅助存储器是主存储器的后援存储设备,用以存放当前暂时不用的程序或数据。对辅助 存储器的基本要求是:容量大、成本低、可以脱机保存信息。目前主要有磁读写、光读写两 类,如磁盘、磁带、光盘、光磁盘等。 1)软盘存储器 软盘存储器由软磁盘、软盘驱动器、软盘适配器三部分组成。它们是目前个人计算机中 应用最为广泛的一种辅助存储器。 2)硬磁盘存储器 硬磁盘的盘片以铝合金为基体,因而“硬”,但存储原理与软磁盘相同,相对软盘,硬 盘存储器存储容量更大,访问速度更快。 3)磁带存储器 磁带存储器是最早应用的磁表面存储器,其特点是存储容量大、价格便宜。 4)光盘存储器 由于多媒体的发展,这促使了光盘技术的迅速发展。光盘存储器是把激光束聚焦成lum 左右的微小光点,使之能量高度集中,在记录介质上产生物理或化学变化而存储信息的。读 出时,激光束在介质上扫描,根据反射光的变化判断记录的数据。 光盘存储技术记录密度高,存储容量大;可长期(60年~100年)保存信息;成本低廉, 易于大量复制;存储密度高,体积小,能自由更换盘片;是很好的大容量存储技术。但是光 盘的数据存取速率比磁盘低,目前一般为50~150MB/S,因此还不能完全取代磁盘。 5)磁盘阵列RAID RAID(Redundant Arrays of Inexpensive Disk)是并行处理技术在磁盘系统中的应用。 它把多台小型的磁盘存储器(或光盘存储器)按一定的条件组织成同步化的阵列,利用类似 于存储器中的多体交叉技术,将数据展开存储在多台磁盘上,提高了数据传输的带宽,并用 冗余技术提高了系统的可靠性。 1.4 输入/输出系统 输入/输出系统是计算机主机与外界交换信息时需要的硬、软件设备的总称,简称外设 系统。一般说来,外设系统的硬件由以下几个方面组成,这里主要介绍外部设备。 1)外部设备:围绕主机而设置的各种信息媒体转换和传递的设备。 2)设备控制器与接口:控制主机与外部设备之间的信息格式、交换过程、外部设备运 行状态的硬、软件,也称设备适配器,它与外部设备的特性有关。 3)I/O总线;主机与外部设备之间的信息传送通路。 1.4.1外部设备及其分类 “外部设备”也称为外围设备。它们是指计算机系统中,除主机以外,直接或间接与计 算机交换信息、改变信息媒体或载体形式的装置。从使用的角度,外部设备大致可以分为如 下三类。 1)人——机交互设备 人一机交互设备,就是用户和计算机间交流信息的设备,其功能是把用户可以识别的信 息媒体,转换成计算机可以识别的信息,如键盘、图形扫描仪、摄像机、语言识别器等;或 者把计算机处理的结果信息,转换为用户可以识别的信息媒体,如打印机、显示器、绘图仪、 语音合成器等。 2)机——机通信设备 机——机通信设备就是一台计算机与其他计算机或别的系统之间通信的设备,如两台相 同型号或不同型号之间的计算机利用电话线路进行通信时,所需的调制解调器(MODEM)以 及用计算机进行实时控制时的数/模(D/A,Analog/Digital)——模/数(A/D)转换设备等。 3)计算机信息的驻在设备 计算机信息的驻在设备,即计算机的外存储设备,如磁盘、光盘、磁带等。这些已在前 面介绍过了。本节主要偏重于介绍人——机交互设备。 1.4.2字符输入/输出设备 1)键盘 字符输入设备的实质是将要输入的字符转换成相应的 0、1 码。目前,键盘是最重要的 字符输入设备,键盘的基本组成元件是按键开关,它的种类很多,一般可分为触点式和无触 点式两大类。 2)打印设备 打印设备是一种硬拷贝设备,它的作用是将输出信息打印在纸上,产生永久性记录。打 印设备种类繁多,有多种分类方法。按印字原理分类,可以分为: g108g32击打式:打印过程打印头要撞击纸。击打式打印机又分为活字式打印和点阵式打印; g108g32非击打式:采用电、磁、光、喷墨等物理、化学方法印刷字符,打印过程纸不被撞 击。如激光印字机(其技术来自复印机)、喷墨印字机等。 按工作方式可以分为: g108g32串行打印机:逐字打印; g108g32行式打印机:一次输出一行。 1.4.3图形/图像设备 1)绘图仪 绘图仪与图形显示器相似而又不同,不同处在于它是输出永久性图形的设备,而图形显 示器是输出过程图形的设备,并且它们的结构元件不同;相似之处在于,它们形成图形的原 理相似,即按形成图形的元素,绘图仪也可以分为向量绘图仪和点阵绘图仪两类。 (1)向量绘图仪 向量绘图仪,又称笔绘图仪,构成向量图形的基本元素是直线段。 (2)点阵绘图仪 点阵绘图仪又称无笔绘图仪,组成点阵图形的基本元素是点,或称象素。属于点阵绘图 机的有静电绘图仪、喷墨绘图仪、热敏绘图仪和激光绘图仪等。 2)摄象机和扫描仪 (l)摄象机 摄象机是最直接的图像输入设备,它能把所摄图像经数字量化后变成数字图像存人磁 带、磁盘或光盘,以备放映。 (2)扫描仪 扫描仪是能够全面而快速输入数据、文字和图形以及图像的输入设备。扫描仪从结构原 理上可分为两大类,一类是CCD作为光敏元件,另一类是以光导纤维作为光的传导元件。在 地理信息系统数据录入中,通过扫描仪得到图像数据,然后进行跟踪矢量化,是快速获取数 据的重要手段。 1.4.4定位及拾取设备 定位/拾取设备通过指点来读取(位于屏幕或图表、图形上的)坐标,以画出或修改图 形。按所拾取的坐标分为两类:拾取绝对坐标,如光笔和数字化仪;拾取相对坐标,如鼠标 器、跟踪球、操纵杆等。 1)光笔 光笔是一种输入设备,用来检测信号,因为外形像支笔,所以叫光笔。其前端装有光敏 器件,后端用导线接到计算机上。当光敏端的笔尖接触屏幕时,产生的光电信号向计算机发 出中断脉冲信号,此瞬间显示存储器的地址就是光笔所指位置,计算机按操作人员的命令作 出响应或画图、编辑和修改。 2)触摸屏 触模屏是一种能对物体的接触或靠近产生反应的定位设备。根据采用技术之不同,触摸 屏分为五类:电阻式、电容式、表面超声波式、扫描红外线式和压感式。 3)数字化仪 在大量GIS应用中,一个至关重要的任务就是要把若干图形输入计算机中去。计算机不 能直接识别这些图形,必须数字化即将其坐标输入到计算机。专门实现这一功能的计算机外 部设备叫数字化仪。即所谓数字化仪是指专门用来读取图形信息的计算机输入装置。 数字化仪设备比较简单,一般由两部分组成,第一部分是感应板部分(又叫画图板 Drawing Board,但叫感应板比较确切),第二部分是点设备(Pointing devices)又叫传送 器或者游标。对于立式的数字化仪还有一个底座,是为了架感应板用的。 数字化仪是计算机图形系统的输入设备。当画笔接触到其图形板上的某一位置时,会将 画笔位置的坐标转换为二进制的数字量,输入计算机,随着画笔的运动,可以把一个图形输 入到计算机中。 数字化 仪的 种类 较多 , 按 测量坐 标的 原理 , 大 体上 可分为 机电 式、 超声 波式 、 磁 致 伸 缩 式和电磁感应式四种,其中电磁感应式是目前最常见的数字化仪。 4)鼠标器、跟踪球和操纵杆 鼠标器 、 跟 踪 球 ( 也 称 轨 迹 球 ) 和 操 纵 杆 , 是 与 屏 幕相配 合拾 取光 标的 相位 坐标的 输入 设备。 1.4.5 虚拟现实设备 一个虚 拟现 实系 统, 可以 分解为 三个 独立 的、 但又 相互联 系的 感觉 引导 子系 统, 即 视 觉 子系统 、听 觉子 系统 和触 觉动觉 子系 统。 这三 个子 系统由 虚拟 环境 产生 器进 行控制 、协 调 , 如图 A1-3所示。 听觉子 系统 视觉子 系统 触觉 / 动觉子系统 命令 数据 头及眼 跟踪 图形、 图象 虚 拟 环 境 产 生 器 手跟踪 数据 图 A1-3:VR 系统一般组成 1)虚拟环境产生器 虚拟环 境产 生器 实质 上是 一个包 括虚 拟世 界数 据库 的高性 能计 算机 系统 。 该 数 据库包 含 了虚拟 环境 中对 象的 描述 以及对 象的 运动 、 行 为 及 碰撞作 用等 性质 的描 述 。 虚拟环 境产 生器 的另一 作用 是生 产图 像。 这 些图像 的生 成必 须在 最短 的时间 延迟 内考 虑参 与者 头部的 位置 和 方向 。 虚 拟 环 境 产 生 器 内 的 任何通 信延 迟都 必将 表现 为视觉 的滞 后 。 如 果 这 种 滞 后可以 感知 , 在某种条件下就会使参与者产生晕眩的感觉。 2)触觉/动觉子系统 为了增 强虚 拟环 境中 身临 其境的 感觉 , 必 须 给 参 与 者 提供一 些诸 如触 觉等 方面 的生理 反 馈,触 觉反 馈是 指 VR 系 统 必须提 供所 能接 触到 的物 体的触 觉刺 激, 如物 体表 面纹理 或甚 至 包括触 摸的 感觉 等 。 参 与 者感觉 到物 体的 表面 纹理 等时 , 同 时也 感觉 到运 动 阻 力 。 当 然 , 毫 无疑 问 VR系 统 中 的 触觉/ 动觉反 馈是 很难 实现 的 。 一 旦实现 , 将极 大地 增强 虚拟 存在的 感受 。 目前触觉/ 动觉系 统中一个 重要的部 分是手跟 踪和手 势跟踪。 它的一个 已经实 用化的设 备 是 数据手套(Data Glove) ,如图 A1-4所示。 图 A1-4:数据手套 数据手 套的 机理 主要 依靠 纤细的 光导 纤维 和光 线的 直线传 播特 性。 它选 用非 常 适合于 屈 伸的材 料制 成 。 对 每 一 个 指头都 有一 根光 纤从 手腕 出发 , 经 指尖 绕回 再到 手 腕处的 光纤 ; 一 端装有光信号源(LED) ,另一端装有测量光通量的光传感器件。在指关节处光纤表面切 有微小 的豁 口 , 当 手 指 弯 曲时豁 口裂 开有 光通 量漏 掉。 当人 带上 手套 后手 指 伸直时 , 由 于 光 线的直 线传 播几 乎能 获 得 100% 的输 出光 量 , 一 旦 手 指弯曲 则光 量随 弯曲 程度 而衰减 。 这 种 光量的 变化 , 在 控 制 器 里 由模/ 数变 换器 (A /D) 转 换成数 字量 , 向 主 计 算 机 传 送 , 并 进 行 计 算、解释。 目前, 数据 手套 暂时 只能 输入手 势语 言信 息, 当人 情不自 禁地 去 “ 触摸” 或 抓放一 个物 体时 , 数 据手 套便 可以 把 这些手 势信 息转 入 ( 反 馈 ) 到 虚 拟 环 境 产 生 器 中 。 当然 , 为 了反 映 手在“抓摸”时的用力情况,还应有压力反馈,这个问题目前正在解决。 3)视觉子系统 视觉是人类 用以接 收信息 的主要器官 。目前 ,VR 技 术中最重要 的一项 技术是 大视场双 眼体视显示技术。 人类的 视觉 , 是 一 个 具 有 双眼坐 标定 位功 能自 然序 列: 人的 两只 眼睛 同时 看 到周围 世界 的同一个窗口,但由于两眼位置上的差别,在视网膜上各自生成略有差别的图像,这两 个图像通 过大脑, 被综合 成一个含 有景物深 度的立 体图像。V R 体 视 显示技 术 用以下两 种方 案解决 这一 问题 : 一 种 是 用两套 主机 分别 计算 并驱 动对应 左右 眼的 两个 显示 器; 另一 种是 用 一套主机分时地为左右两眼产生相应的图像。 图 A1-5:一种头盔式显示器及其分解图 目前, VR显 示 装 置 的 主 流 是头盔 式显 示器 。 图 A1-5为头盔 式显 示器 原理 的分 解图。 当 然,最重要的还是要能在显示屏上产生清晰、逼真的图像。 4)听觉子系统 通常听觉 系统也 安装 在头 盔显示器 上。听 觉子 系统 主要由声 音合成 、3D 声音 定域和 语 音识别组成,以给虚拟环境中的用户一个真实的声音环境。 (l)声音合成 尽管听 觉系 统以 比视 觉系 统低得 多的 频带 宽度 工作 , 但人的 听觉 系统 很善 于在 众多的 声 音中挑 取特 定的 声音 ,作 为对视 觉摄 取信 息的 补充 。因此 ,在 VR 系统 中加 入 声音合 成装 置 是十分必要的。当视觉系统处理某一事件时,听觉系统同时在后台工作。 (2)3D 声音定域 为造成 逼真 的声 音环 境 , 就 要使参 与者 能通 过两 耳因 位置不 同 , 所接 受的 声波 的时 差 等 , 分辨出 声源 与自 己的 相对 位置 ; 即 使参 与者 在头 部 运动时 , 也 能 感 觉 这 种 声 音保持 在原 处不 变。 为了 达到 这种 效果 , 声音定 域系 统必 须考 虑参 与者两 个 “ 耳 廓 ” 的 高 频 滤波特 性 。 参 与 者头部 的方 向对 于正 确地 空间化 声音 信号 是很 重要 的。 因此 , 虚 拟 环 境 产 生 器 要为声 音定 域 装置提供头部的位置和方向信号。 (3)语音识别 语音识别在输入数据大量时,是非常有效的。 1.4.6调制解调器 目前使用的计算机一般都是数字计算机,即在计算机中处理的是数字信号,而普通电话 线上传输的是音频信号。用普通电话线传输数字信号的效率是很低的。为了能用普通电话线 进行计算机通信,应当把要发送的数字信号先调制(Modulate)成音频信号,送到目的地后 再解调(Demodulate)成数字信号。完成这一功能的设备称为调制解调器MODEM。由于一台 计算机既要接收信号,又要发送信号,所以调制解调器既有调制功能,又有解调功能。调制 解调器是拨号接入方式下的关键设备。 一些新的输入输出设备: 随着计算机技术的发展,出现了一些新的、更加方便的输入输出设备,下面是其中的简 单介绍: 源数据自动化设备:包括条形码阅读机,磁性墨水字符阅读机(用于支票上的数字)。 语音录入:也称为“语音识别”,允许用户通过讲话向系统发出指令。 数码相机:可以直接得到数字图像,并由软件进行进一步的处理。 1.5 计算机系统性能 全面衡量一台计算机的性能要考虑多种指标,并且对不同的用途所侧重的方面不同。下 面从普遍应用的角度,介绍主要的几种性能指标。 1)CPU字长 CPU字长是指CPU一次所能处理的位数。CPU字长越长,表明 CPU 所能处理的数据的精 度越高,并且影响处理的速度。因为短字长的 CPU 对较大的数据要通过两次甚至多次运算 实现。目前微型计算机的字长从8位、16位、32位,到64位等。当然CPU字长越长,价格 就越高。为了适应不同的需要,并协调精度与成本,人们还设计了可变字长计算,如半字长、 全字长、双字长等。 2)主频率 CPU工作的节拍是由主时钟控制的。主时钟不断地产生固定频率的时钟脉冲,时钟脉冲 的频率就是CPU的主频率。主频率越高,CPU的工作节拍越快。这是影响机器运算速度的重 要参数。 3)主存容量 主存用以直接与CPU交换信息。主存容量大,处理问题的能力就强。同时由于它与外存 之间的信息交换次数少,解题时间效率高。计算机的最大主存容量由CPU的地址总线的根数 决定。地址总线为 16 条时,CPU 的最大寻址范围为 64K;地址总线为 20 条时,CPU 的最大 寻址范围为1M。目前,微机地址总线为32条,最大寻址空间为4G。 4)软、硬件配置及性能价格比 软、硬件配置包括外部设备的配备情况,指令系统以及操作系统功能的强弱、界面是否 友好,有无其它支持软件和应用软件等。性能价格比是人们对经济效益的选择,这个值越大 越好。 5)RASIS特性 可靠性(Reliability)、可用性(Availability)、可维护性(Servicebility)、完整 性(Integrality)和安全性(Security)统称 RASIS。它们是衡量一个现代化的计算机系 统性能的五大功能特性。 6)兼容性 所谓兼 容性 ( Compatibility) , 是 指系 统间 所含 的某 些 “ 东西 ” 具 有 并 存 性 , 即意味 着 两个系统之间存在着一定程度的通用性,它使机器能承前启后、便于推广。 2.数据库系统基础 目前 , 数 据库 管理 系统 ( DBMS,Data Base Management System) 正日益 进入 最终 用户的 日常应 用 , 人 们 每 天 都 在 日常生 活中 用到 数据 库 , 如使用 信用 卡购 物 、 订 票 、 书目查 询等 等, 在使用 过程 中 , 用 户 不 需 要了解 数据 的具 体存 取和 管理方 式 , 正 是 数 据 管 理 系统提 供了 这些 功能。 2.1 数据库的基本概念 定义数 据库 管理 系统 之前 , 必 须首 先定 义这 种系 统 的基本 成分 —— 数据 库 , 一个数 据库 有四个 主要 成分 : 数据 、 联系 ( Relationship) 、 约束 ( Constraint) 和模 式 ( Schema) (图 A1-6) 。 数据是 所存 储的 逻辑 实体 在计算 机中 的二 进制 表示 ; 联 系表 示数 据项 之间 的 某种对 应 ; 约 束 是定义正确数据状态的断言;一种模式描述数据库中数据的组织和联系。 数据库 数据项 联系 约束 模式 图 A1-6:数据库组成 模式为 数据 库管 理系 统各 个组成 部分 的使 用和 应用 的安全 定义 数据 库的 各种 视图。 模式 将数据 存储 的物 理外 表与 逻辑表 示分 开 ( 见图 A1-7) 。 内 部模 式定 义数 据在 物理 数 据 存 储 区 中如何 组织 以及 放在 何处 。 概 念模 式模 型按 照适 当 的数据 库数 据模 型 ( 如 关 系模型 或对 象模 型)定义所存储数据的结构。外部模式为特定用户们定义数据库的一个或多个视图。 物理数 据库 内部模 式 内部模 式 外部模 式 1 外部模 式 1 外部模 式 n … 图 A1-7:数据库模式的概念 数据库 管理 系统 为访 问数 据库提 供服 务, 同时 维护 存储数 据所 要求 的正 确性 和一致 性 。 在数据 库管 理系 统中 , 运 行的工 作单 元是 事务 ( Transaction) 单 元, 在此 之上定 义 了 一 致 性 和 正 确性。事务 应该支 持 ACID 属性 。 ACID 属性 包 括 : 事 务运 行的 原子性( Atomic) 、 一致性( Consistent) 、独立性( Isolation)和事务执行的持久性( Durability) 。 1) 原 子性 确保 事务 被当 成一 个 不 可 分 割 ( All- or- Nothing, 要 么全 做, 要么 根本 不 做 ) 的操作单元处理。 2) 事务 操作 的一 致性 确保 数据库 从原 来的 一致 性状 态正确 转移 到一 个新 的一 致性状 态 , 此处的一致性由数据库中数据项上的谓词定义。 3)事务的 独立属性 定义了 允许它们 可见什么 。一个 被孤立的 事务只“ 看到” 数据库 的 一个视图,就好像事务是单独在数据库上执行一样。 4)持久性属性确保一旦提交了一个事务,其结果就持久存 在且不能从数据库中消除。 2.2 数据库的数据模型 按照描述 数据与数 据间关 系的方法 不同,数 据库常 用的数据 模型有层 次模型 、网状模 型 和关系模型。 2.2.1 层次模型 层次模型是一种基 本层次 联系的集合,它实 际上是 一种有根定向的有 序树, 如图 A1-8 所示 。 层 次模 型的 基本 结 构是树 结构 —— 根 、 枝 、 叶结构 , 数 据 存 放 的 基 本 单位是 片断 ( 即 层) ,片断 是内在 有逻辑联 系的一组 数据,总 的来说 ,层次模 型按照树 形结构 以片断为 单 位 存放数据。层次模型比较容易实现,但是查找比较麻烦,数据的冗余度也比较大。 道路 时令路 公路 大车路 铁路 乡村路 小路 简易 公路 公路 建筑 中公 路 单轨 铁 路 窄轨铁 路 建筑 中铁路 双轨铁 路 R 2 R 11 R 12 R 13 R 14 R 9 R 8 R 10 R 3 R 4 R 5 R 6 R 7 …2 层 …3 层 图 A1-8:数据库层次模型 2.2.2 网状模型 所谓网 状模 型是 指一 个连 通的基 本层 次联 系的 集合 ,如图 A1-9 所示。 复杂 的 网总可 以 分解成若 干个基本 结构, 即分解成 系。系有 系主( 只有一个 )和系属 (可以 有多个) ,系主 和系属之间有关系,而且关系是双向的。 工人数 农民数 干部数 知识分 子 R 1 R 2 R 5 R 3 R 4 有职业 人口 数 无职业 人口 数 R 7 R 6 R 9 R 11 R 10 R 8 流动人 口数 居住人 口数 总人口 数 人口密 度 人口 图 A1-9:网状模型示例 网状模 型存 放的 基本 单位 是记录 , 也 就是 按记 录存 放, 查 询时, 从系 (系 主 和系属 ) 查 起。网状模型查找时间较省,数据和冗余度比层次模型小,但比关系模型要大。 2.2.3关系模型 关系模型是目前最为流行的数据模型,它是由许多二维关系表组成的集合。例如表 1 就是一张关系表, R是关系名, A i 是属性名,关系和属性( R,A 1 ,A 2 …A n )组成了数据表的模 式(Schema) ;V ij 叫做分量,表中的一列是一个属性,相当于一个数据项(或数据元素) ,一 行叫做—个元组(Tuple ),相当于一条记录。 关系模型中所有数据都按表格存放,有关系的数据放在一张表上,表与表之间有连接。 表 A1-1:关系表 R A 1 A 2 … … … A j … … … A n V 11 V 12 … … … V lj … … … V ln ∶∶∶ V il ∶∶∶ ∶∶∶ V i2 ∶∶∶ ∶∶∶ ∶∶∶ ∶∶∶ V ij ∶∶∶ ∶∶∶ ∶∶∶ ∶∶∶ V in ∶∶∶ V m1 V m2 … … … V mj … … … V mn 关系模型的特点是每一个分量必须是不可分割的数(数据元素),也就是不允许表中还 有表。另外表和表之间的联系要用关系表示,而不是用其它表示。 关系模型查找很方便,数据冗余度小,但关系联结时效率较低。 关系表的操作可以分为以下四种: 1)通用的集合操作,如并、交、差运算等; 2)去除关系表的某些部分的操作,包括选择 (Selection)和投影(Projection) ,前者去除某 些元组,后者则用于除去某些属性; 3)两个关系表的合并,包括“笛卡尔积”以及各种方式的连接运算; 4)更名操作,即对关系表属性名称的修改,它不改变元组,但是改变了关系表的模式。 下面以常见的学生管理例子说明这些操作: 学生关系表 R1 姓名 年龄 性别 Carola 20 女 Maxwell 21 男 Churchill 18 男 学生关系表 R2 姓名 年龄 性别 Johnson 17 男 Maxwell 21 男 Barbara 24 女 Williams 20 女 学生成绩表 R3 姓名 语文 数学 Johnson A A Maxwell B A Barbara A A Williams A C Carola C C Churchill C B 对 R1 和 R2 进行求交集运算的结果(R4 ) 姓名 年龄 性别 Maxwell 21 男 对 R1 和 R2 进行求并集运算的结果(R5 ) 姓名 年龄 性别 Johnson 17 男 Maxwell 21 男 Barbara 24 女 Williams 20 女 Carola 20 女 Churchill 18 男 对 R5 和 R3 根据“姓名”进行连接操作结果(R6 ) 姓名 年龄 性别 语文 数学 Johnson 17 男 A A Maxwell 21 男 B A Barbara 24 女 A A Williams 20 女 A C Carola 20 女 C C Churchill 18 男 C B 对 R6 选择“性别= “男””,并且对姓名、语文、数学成绩进行投影的结果(R7 ) 姓名 语文 数学 Johnson A A Maxwell B A Churchill C B 关系数据库的查询和修改操作是通过 SQL(结构化查询语言,Structured Query Language),SQL 的基础是关系代数,同时也包括了其它的一些操作,如求和、汇总、数据 更新等等,下面是一个 SQL 查询的例子: 对于关系: 省份(省会,人口,产值,面积) SQL 语句: Select * From 省份 Where 人口 >60,000,000 and 面积 <160,000 用于查询得到人口大于 6 千万并且面积小于 16 万平方公里的省份。 2.2.4面向对象数据库模型 网络和层次以及关系模型都适合那些结构简单以及访问有规律的数据。这些模型的最佳 应用领域有个人记录管理,清单控制,终端用户销售,商业记录等,所有这些应用领域都只 有相当简单的数据结构、联系以及数据使用模式。但是,当试图把这三种模型应用于更高级 的领域时,数据不能用类似于记录这样的简单结构来表示了,访问和操作方法也不再简单。 这些应用领域需要更复杂的抽象数据类型,如图形,声音,图标,包,清单,队列,以及地 图,这些数据类型都各自定义了独特的操作方法——例如,一个地图对象可以定义为经度、 纬度、地点的时间维;以等高线来定义地形;用图标表示主要的嵌入对象,而他们本身也可 能是对象。除了这些定义之外,在地图的各区域可能还含有隐藏的数据。我们可以表示人口 密度、动物密度、植物、水源、建筑物及其类别(例如,单个住宅楼,高楼,工业建筑,居 民楼)、污染情况以及其他信息,所有这些都是从应用领域典型使用中派生出来的抽象数据 类型(图 A1-10)。 图 A1-10:地图抽象数据类型 面向对 象数 据库 的引 入就 是为了 满足 一再 出现 的复 杂信息 的共 享。 在复 杂数 据 进入数 据 库以后 , 数 据 库 提 供 了 存 贮信息 的统 一视 图 , 与 具 体存贮 结构 无关 。 把 物 理 数据结 构与 逻辑 数 据 结 构 分开, 同时 控制数 据 的 共 享 及 保 持 数 据 的 正 确 性 、 完 整性 和一 致性, 大大 方便 了应 用程序 的开 发和 维护 , 减 少生命 周期 内的 各种 费用 。 通 过一 组优 化的 程序 来 管理数 据 , 使 得 整体效果更优,性能更稳定。 2.3 数据库管理系统 数据库 管理 系统 ( DBMS) 是为数 据库 访问 提供 服务 的软件 , 同 时 维 护 所 有 数 据必需 的 特性。数据库管理系统为支持应用程序访问和操作数据库数据提供下列服务: 1)事务处理 事务将 使数 据库 从一 个一 致状态 转移 到另 一个 一致 状态 。 数 据库 操作 被分 成 两大类 : 数 据访问 操作 和事 务操 作 。 有三种 特定 的事 务操 作 : 启动 ( Start) 指 示 将 开 始 一个新 事务 , 提 交( Commit) 指示事务已 正常终 止且 其作 用结 果将 持久存 在, 以及放 弃 ( Abort) 指示事 务 被异常终止,其所有结果将被放弃。事务通常需要具有前面提到过的 ACID 属性。 2)并发控制 并发控 制是 一种 数据 库管 理活动 , 它 协 调 数 据 库 操 作 进程的 并发 操作 和对 共享 数据的 访 问, 并且 解决 它们 之间 可 能发生 的潜 在冲 突 。 并 发 控制机 制的 目标 是允 许并 发维护 共享 数据 的一致性,数据库系统中的并发单元是事务。 3)恢复 数据库中恢复的目标是确 保异常终止或出错的事务 不会对数据库或其他事务 产生不利 影响 。 异 常终 止的 事务 有 两种影 响 ; 对 数 据 的 影 响 和对其 他事 务的 影响 。 恢 复可使 得数 据库 在事务异常终止后返回某个一致状态。 4)安全 安全是 保护 数据 免受 非授 权的泄 露 、 更 改 或 破 坏 。 每 个用户 和应 用程 序都 有特 定的数 据 访问 特权。这些特 权可以由外 部模式定义, 即根据各个 用户被允许访 问和 /或修改 的数据, 给予它 们不 同的 数据 视图 。 安 全系 统提 供一 些方 法 , 来决定 每个 用户 或应 用程 序可访 问什 么 视图 。 通 过授 权和 身份 鉴 别过程 , 安 全 还 具 有 限 制 初始访 问数 据库 的功 能 。 这些过 程中 最常 用的是注册名和口令保护服务。 5)语言接口 DBMS 提 供 对 用于定 义和操 作数 据的 语言 的支 持。概 念模 式是 用数 据定 义语言 ( Data Definition Language, DDL)说明的。这种数据库语言部件是用来描述数据、数据间联系和 对数据和联系的约束的表示法。DDL 首先用在数据库设计时,以后修改模式时还会用到 DDL。 数据操纵语言( Data Manipulation Language,DML )用于表达数据库上的操作。 DML 有时也称为查询语言。 DBMS 提供 DML,以便用户和应用程序编写者访问数据库中数据, 而不必知道数据库如何存储数据或把数据存在何处。 6)容错性 不管发生什么故障仍能继续提供可靠 DBMS 服务的能力称为容错性。一个出错的数据 库部件将使与其交互的其他部件产生故障。典型的数据库故障包括违反约束和事务超时错 误。如上所述,恢复与容错性密切相关,因为恢复是一种机制,它能容许发生使事务异常终 上的差错。 7)数据目录 数据目录(有时称为数据字典)是一个系统数据库,它含有主数据库中数据的描述(有 时被称为元数据, Metadata)。它包含有关数据、联系、约束的信息,以及将这些特征组织 到一个统一数据库中的所有模式的信息。通过查询目录可获得有关主要数据库结构的信息, 因而目录被看成一个数据库。 8)存储管理 DBMS 提供数据持久存储的管理机制。内部模式定义数据应该如何用存储管理机制存 储。为了访问物理存储,存储管理系统与操作系统间有接口。 3.数据结构和算法 3.1 数据结构的概念 3.1.1数据结构——一个例子 从提出一个实际问题到计算机解出答案需要经过下列步骤: 首先从实际问题抽象出一个 数学模型,然后设计一个解此数学模型的算法,最后编出程序、进行测试、调整直至得到最 终解答。寻求数学模型的实质是分析问题,从中提取操作的对象以及这些操作对象之间含有 的关系,然后用数学语言加以描述。例如,在分析了一个物理现象或化学现象变化的规律之 后可以得到一组代数方程或微分方程。然而,更多的问题无法用数学方程加以描述。下面用 一个例子来说明数据结构。 多叉路口交通灯的管理问题。通常,在十字交叉的路口只要设红绿两色的交通灯便可保 持正常的交通秩序,而在多叉路口需设几种颜色的交通灯才能既使车辆相互之间不碰撞而又 达到最大的流通呢?假设有如图 A1-11(a)所示的五叉路,其中 C 和 E 为单行道,在路口 有13条可行的通路,其中有的可以同时通行,如A→B、和E→C,而有的不可同时通行,如 E→B 和 A→D,那末,在路口应如何设置交通灯进行管理?这个问题可以转换成一个图的染 色问题。假设在图上以一个圆圈表示一条通路,在不能同时通行的两个圆圈之间画一连线, 对图中的圆圈上色,要求同一连线上的两个圆圈不同色且颜色种类最少。图 A1-11(b)是 与图 A1-11(a)相应的图,图中 13 个圆圈表示 13 条通路,圆中的号码分别表示四种颜色 的交通灯。 图 11:五叉路口交通管理意图 (a)三叉路口(b)表示通路的图 由以上 例子 可见 , 描 述 这 样一类 问题 的数 学模 型不 再是数 值方 程 , 而 是 诸 如 表 、 树 和 图 等的非 数值 性的 数据 结构 。 因 此, 简单 说来 , 数 据 结 构就是 一门 研究 非数 值性 程序设 计中 计 算机操作的对象以及它们之间的关系和运算等的学科。 3.1.2 基本术语 下面是数据结构中常用到的名词和术语的含义: 1)数据(Data) 数据是 描述 客观 事物 的数 、 字符以 及所 有能 输入 到计 算机中 并被 计算 机程 序处 理的符 号 的集合。 它是计算 机程序 加工的“ 原料” 。 例如,一 个利用数 值分析的 方法解 代数方程 的 程 序处理 的对 象只 是整 数和 实数 , 而 一个 编译 程序 或 文字处 理程 序的 对象 是字 符串 。 因 此, 对 计算机而言,数据的含义极为广泛,如图形、声音等都属于数据的范畴。 2)数据元素(Data Element) 是数据的 基本单 位, 即数 据这个集 合中 的一个 个体 (客体) 。有时 一个数 据元 素可由 若 干个数据项(data item)组成,数据项是数据的最小单位。 3)数据对象(Data Object) 是具有 相同 特性 的数 据元 素的集 合, 是数 据的 一个 子集。 例如 , 整 数的 数据 对象是 集 合 N={…,-2,-1,0,1,2,…} ,字母字符的数据对象是集合 C={A,B,…,Z} 。 4)数据结构(Data Structure) 简单说 来, 数据 结构 是带 有结构 的数 据元 素的 集合 。 从 上 述 面 的 例 子 可 以 看 到 , 被 计 算 机加工 的数 据元 素都 不是 孤立的 , 在 它 们 之 间 存 在 着某种 联系 , 这 种 相 互 的 关 系 , 通 常 称 做 结构。我们可以从集合论的观点加以形式化描述。 数据结构是一个二元组 Data-Structure=(D,R) 其中:D 是数据元素的集合, R是 D上关系的集合。例如,复数可被定义为一种数据结构: Complex=(D,R) 其中 D={ x|x是实数} R={R1} R={<x,y>|x,y∈D,x 称为实部, y称为虚部 } 由此,由任何一对实数均可得到一个复数。 在上面 对数 据结 构的 定义 中,R 集合 中的 关系 指的 是数据 元素 之间 的逻 辑关 系,因 此 , 又称数 据的 逻辑 结构 。 与 此对应 , 则 有 数 据 的 物 理 结 构 , 又 称 存 贮 结 构 , 是 数据结 构在 计算 机中的映象(或表示) 。 5)数据类型(Data Type) 是程序 设计 语言 中所 允许 的变量 的种 类 , 换 句 话 说 , 是变量 可能 取的 值和 能作 的运算 的 集合 。 在 每一 种程 序设 计 语言中 都有 一组 它所 允许 的基本 数据 类型 。 各 种 语 言所能 提供 变量 类型的 多少 决定 了该 语言 功能的 强弱 。 我 们 可 以 把 数 据类型 看作 是程 序设 计语 言中已 经实 现 的 数 据 结 构 , 如 复数、 数组 等。 因此, 数据 类型 实际 上 是 数 据 结 构 (包 括逻辑 结 构 和 存 贮 结 构)及其运算的总称。 3.2 两种重要的数据——树和图 3. 2. 1 树和二叉树 树( Tree) 是 一种 重要 的非 线性结 构, 在计 算机 软件 设计中 被广 泛使 用, 如哈 夫曼树 可 以应用于数据压缩编码,而 B + 树则在文件系统管理中被使用。图 A1-12 表示了树的示例。 A B C D E F G H 子树 图 A1-12:树的示例 在图 A1-12 中, 结点 A 为 树的根 , 根 的每 个分 支称 为子树 ( Subtree) , 子 树 也 是一棵 树; 结点子 树的 根为 结点 的孩 子( Child) ,如 B、 C、 D 为结点 A 的孩 子, 而 A 为 B、 C、 D 的 双亲 ( Parent) ; 同 一 个 双 亲的孩 子之 间为 兄弟 ( Sibling) 关 系; 没有 孩子 的结点 为 树 的 叶 子 ( Leaf) , H、 F、 G、 D 为树的叶子。 树的基本操作包括: 1)初始化一棵树; 2)得到树的根; 3)得到一个结点的双亲; 4)得到一个结点的兄弟; 5)得到一个结点的孩子; 6)插入子树; 7)删除子树; 8)遍历( Travers)树; 9)清空树。 在不同的软件系统中,由于具体实现的不同树的操作也不同。 二叉树 ( Binary Tree) 是 另 一种树 型结 构 , 其 特 点 是 每个结 点最 多有 两棵 子树 。 树 和二 叉树之间可以相互转换。 各种特 定的 树型 结构 被广 泛应用 于查 找算 法的 实现 中, 它们 可以 加快 查找 的 速 度 ; 在 地 理信息系统中,可以用于空间索引的建立,以提高空间要素的检索效率。 3. 2. 1 图 图( Graph)是 较树更为 复 杂的数据结 构,在 图中, 结点之间的 关系是 任意的 ,图中任 意两个数据元素都可能相关。图 A1-13 给出了图的示例。 2 3 1 4 21 3 4 5 ( a)有向图 ( b)无向图 图 A1-13:图的示例 图的形式化定义为: Graph = (V,R) 其中: V={x|x∈dataobject } R={VR} VR={<x,y>|P(x,y)∧ (x,y∈V )} 图中数 据元 素称 为顶 点 ( Vertex) , V 是 顶 点 的有穷 非 空集合 ; VR 是两 个顶 点之 间的关 系的集 合, 其定 义 中 P(x,y)表示 x 到 y 的一条单 向通 路;若 <x,y>∈VR ,则 <x,y>表示 从 x 到 y 的一条弧,此 时图 称为 有向图 ( Digraph) ;若 <x,y>∈V R 必 有 <x,y>∈VR, 则 此时图 称为 无 向图。 在图中 , 如果 <x,y>∈VR , 则x , y互 为邻 接点 。 路径 (P ath) 是一 个顶 点序 列 (V 1,V2,…Vn) , 其中V i和V i+1为邻接点。 图可以 有多 种存 储结 构, 其中最 普通 的是 采用 邻接 矩阵, 如果 两个 结点< Vi,Vj>∈VR, 则 矩阵对应元素A[i,j]=1,反之,A[i,j]=0。 无向图 的邻 接矩 阵是 对称 的, 而 有 向 图 的 邻 接 矩 阵 则不一 定对 称, 图 A1-13 中 两 个图的 邻接矩阵如下(其中没有考虑相同点邻接性) : g250 g250 g250 g250 g250 g250 g251 g249 g234 g234 g234 g234 g234 g234 g235 g233 = g250 g250 g250 g250 g251 g249 g234 g234 g234 g234 g235 g233 = 01001 10100 01001 00001 10110 0001 1000 0000 0101 b a 在地理 信息 系统 中 , 可 以 应用图 数据 结构 进行 网络 分析 , 判 断两 个空 间要 素 之间的 连通 性及其最短路径。 3.3 算法 3.2.1 算法的概念和特性 数据结 构和 算法 构成 了计 算机程 序 , 所 谓 算 法 ( Algorithm) , 是 对特 定问 题求解 步 骤 的 一种描 述 , 它 是 指 令 的 有 限序列 , 其 中 每 个 指 令 表 示一个 或者 多个 操作 。 一 个算法 还具 有以 下五个重要特征: 1)有穷性 一个算法必须总在执行有穷步之后结束,而且每一步都可以在有穷时间内完成; 2)确定性 算法中 的每 一步 必须 有明 确的含 义, 不会 引起 二义 性 ; 并且 , 算法 只有 唯一 的执行 路 径 , 即相同的输入只会得到相同的输出。 3)可行性 一个算法必须是可行的,即算法中的操作都是可以通过已有的基本运算完成。 4)输入 一个算法可以有零个或者多个的输入。 5)输出 一个算法有一个或者多个的输出,这些输出同输入有特定的关系。 3.2.2 算法设计的要求 设计一个“好”的算法应该考虑达到以下目标: 1)正确性 算法应该满足具体问题的要求,对于输入数据能够得到符合规格说明的结果。 2)可读性 算法的可读性有助于人对算法的理解,便于修改和调试。 3)健壮性 当输入数据非法时,算法也能够正确处理,而不会出错。 4)效率与低存储量需求 效率指的是算法执行时间,一个算法执行时间越少,效率越高;存储量需求是指算法执 行过程中所需要的最大存储空间。一个好算法要有高的执行效率和低的存储量需求,但是在 实际实现中,二者并不可以兼得,通常可以用大的空间开销来提高算法执行效率,或者以降 低执行速度作为减少空间开销的代价。 决定一个算法的效率和存储需求的因素包括书写程序的语言、生成的机器代码的质量、 机器执行指令的速度等等,但最重要的是算法解决问题的规模。一个算法是由控制结构(顺 序、分支和循环三种)和原操作构成,通常是在算法中选取一个基本原操作,并以该操作重 复执行的次数作为算法的时间度量。 一般情况下,算法中基本操作重复执行的次数是问题规模 n 的某个函数 f(n),算法的 时间量度记做: T(n)=O(f(n)) 它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称为算法的渐近 时间复杂度,简称时间复杂度(Time Complexity)。常见的算法时间复杂度有O( 1)、O( n)、 平方阶O( n 2 )、对数阶O(log n)、指数阶O( 2 n )等等,在算法设计时,可以根据时间复杂度对算 法优劣进行评判,通常指数阶的时间复杂度是不可以考虑的。 算法执行所需要的存储空间通过空间复杂度来度量,记做: S(n)=O(f(n)) 其意义类同于时间复杂度。 软件,是“固化”的思想。 杨芙清 附录二 GIS 工具软件介绍 导读:本章介绍了比较常用的一些地理信息系统软件,具体包括三家美国GIS开发 商ESRI,Intergraph和MapInfo的软件产品,以及三个国产软件:MapGIS,GeoStar 和Citystar。 介绍的内容来自于各个公司的宣传材料以及WWW上各个公司的主页,但是除去了 诸如“第一”,“最好”等的修饰词汇。另外,由于软件在不断升级,在本章中也不 具体说明软件版本号,并且也不评判软件的优缺点,只是简要列出了各个软件的模 块名称和功能目标。 这些软件,提供了相似的功能集合,不同之处在于其具体的实现方式(如用户界面, 操作流程),和操作效率(如速度、数据量)。这种相似性,也正说明了GIS技术的 成熟。 1. ESRI 产品系列 ESRI 公司( Environmental Systems Research Institute Inc.)于 1969 年成立于美国加利福 尼亚州的 Redlands 市,公司主要从事 GIS 工具软件的开发和 GIS 数据生产。 ESRI 的产品中,最主要的是运行于 UNIX/Windows NT 平台上的 ArcInfo,它由两部分 组成:Workstation ArcInfo 和 Desktop ArcInfo。 1) Workstation ArcInfo 基于拓扑数据模型,实现了图库(Map Library )的管理,并且具 有了栅格数据的分析功能,支持栅格矢量一体化查询和叠加显示。此外, ArcInfo 还提供了 二次开发语言 AML 以及开放开发环境 ODE,以便于用户定制自己的 GIS 应用。 Workstation ArcInfo 提供了最基本的 GIS 功能,包括数据录入和编辑、投影变换、制图 输出、查询分析及其分析功能(缓冲区分析、叠加复合分析等等)。 除了上述基本功能以外, Workstation ArcInfo 还通过一些扩展模块实现特定的专门功能: TIN: 基于不规则三角网的地表模型生成、显示和分析模块,可以根据等高线、高程点、 地形线生成 DEM,并进行通视、剖面、填挖方计算等。 GRID:栅格分析处理模块,可以对栅格数据进行输入、编辑、显示、分析、输出,其 分析模型包括基于栅格的市场分析、走廊分析、扩散模型等。 NETWORK: 网络分析模块,提供了最短路径选择、资源分配、辖区规划、网络流量 等功能,可以应用于交通、市政、电力等领域的管理和规划。 ARCSCAN: 扫描矢量化模块。 ARCSTORM: 基于客户机/ 服务器机制建立的数据库管理模块,可以管理大量的图库 数据。 COGO: 侧重于处理一些空间要素的几何关系,用于数字测量和工程制图。 ArcPress: 图形输出模块,可以将制图数据转换成为 PostScript 格式,并可分色制版。 ArcSDE: SDE 指空间数据引擎(Spatial Database Engine ) ,它是一个连续的空间数据模 型,通过它可以将空间数据加入到关系数据库管理系统中去,并基于客户机 /服务器机制提 供了对数据进行操作的访问接口,支持多用户、事物处理和版本管理。用户可以以 ArcSDE 作为服务器,定制开发具体的应用系统。 ARC/INFO 的图库管理 为了能 够管 理分 布在 不同 图幅的 多个 专题 要素 ,在 ARC/INFO 的图库中 ,把 地图数 据 纵向分为“图层( Layer) ” ,而水平方向分为“图块( Tile) ” ,如图 A2-1 所示。 图层 图块 图 A2-1: ARC/INFO 的图库管理 在上图 中, 描述 同一 区域 的不同 专题 图块 构成 一个 “地图 ( Map) ” ,基 于这 种方式 的管 理, 可以根 据内 容或 区域 范围 任意调 入相 关的 数据 ,并 且便于 实现 数据 共享 ,和 并发访 问控 制 。 2) Desktop ArcInfo 包括 三 个应用 : Arc Map、 Arc Catalog 和 Arc Toolbox。 Arc Map 实 现了地 图数 据的 显示 、查 询和分 析; Arc Catalog 用 于基于 元数 据的 定位 、浏 览和管 理空 间 数据; Arc Toolbox 是由常用数据分析处理功能组成的工具箱。 3) ArcView GIS(图 A2-2)是 ESRI 的桌 面 GIS 系统 , 它以工 程为 中心, 实现 了对地 图 数 据 、 结 构 化 的 属 性 数据、 统计 图、 地图 图面 配置、 开发 语言 等多 种文 档的管 理。 除了 提供 脚本语 言 Avenue 使用 户可 以定制 系统 以外 , ArcView 还以 “插 件” 的形 式提 供了一 些扩 展 模块,包括: Spatial Analyst: 栅格数据的建模分析; Network Analyst: 网络分析; ArcPress: 制图输出; 3D Analyst: 利用 DEM 实现三维透视图的生成; Image Analyst: 影像分析处理; Tracking Analyst: 通过直接接收、回放实时数据,实现对 GPS 的支持。 图 A2-2: ArcView GIS 用户界面 4) MapObjects 是一 组供 应 用开发 人员 使用 的 GIS 功能 OCX( OLE Custom Control)控 件, 用户 可以 采用 其它 的支持 OCX 的开发 平台 , 如 Visual Basic, Delphi 等, 集成 MapObjects, 建立具体的应用系统。 5) ArcFM,支持公共设施规划、管理和服务的模块。 6) Internet Map Server(IMS),实现了因特网上地理数据发布功能。 2. Intergraph 产品系列 Intergraph 公司 成立 于 1969 年, 总部位 于美 国阿 拉巴 马州的 汉斯 维尔 市, 公司 致力于 计 算机辅助设计、制造以及专业制图领域的硬件软件以及服务支持。 Intergraph 提供 的 GIS 产品 包括专 业 GIS 系统 ( MGE) ,桌 面 GIS 系统 ( GeoMedia) , 以及因特网 GIS 系统( GeoMedia Web Map) 。 1) MGE 构成 了 Intergraph 专业 GIS 软件 产品 族, 它 包括多 个产 品模 块, 提供 了从扫 描 图像矢 量化 ( I/GEOVEC) , 拓扑空 间分 析 ( MGE Analyst) 到地图 整饰 输出 ( MGE Map Finisher) 的基 本 GIS 功能 , 此 外还包 括 了 其 它 一 些 扩 展 模 块 , 实 现了 图像 处理 分析 ( I/RAS C, MGE Image Analyst) ,网络分 析 ( MGE Network Analyst) ,格网 分析 ( MGE Grid Analyst) ,地形 模型分 析( MGE Terrain Analyst) ,基于真 三维 的地 下体分 析( MGE Voxel Analyst)等一系 列增强功能。 2) GeoMedia Professional(图 A2-3)设 计成 为与 标 准关系 数据 库一 起工 作, 用于空 间 数据 采集 和管 理 的 GIS 产 品 , 它 将 空 间 图形数 据和 属性 数据 都存 放于标 准关 系数 据库 ( Microsoft Access) 中, 在 一定程 度上 提高 了系 统的 稳定性 和开 放性 , 并 且 提 高了数 据采 集、 编辑、 分析 的效 率。 它支 持多种 数据 源, 包括 其 它 GIS 软件 厂商 的数 据文 件 以及多 种关 系 数据库 ;实 现了 矢量 栅格 的集成 操作 ;提 供了 多种 空间分 析功 能; 此外 , GeoMedia 包含 其 它一些模块,以应用于不同的具体领域。 GeoMedia Network:可以 应用于 交通 网络 以及 逻辑 网络的 管理 、分 析、 规划 ,具体 包 括最短路径查询、线路规划等功能。 GeoMedia SmartSketch: 具有较 强的 图形 编辑 能力 , 是一个 计算 机辅 助设 计 (CAD)软件 。 GeoMedia Relation Moduler: 用 于 建 立 设 备 间 的 网 络关系 ,可 以应 用于 自来 水,煤 气 等市政管网的管理以及设备跟踪。 GeoMedia Object: GeoMedia 是基 于控 件的 系统 , 它 包含多 个 OCX 控件 , 基 于 这些控 件,用户可以开发具体的应用系统。 GeoMedia MFworks: 基于栅格数据的分析模块,包含多种控件操作函数。 GeoMedia Oracle GDO Server: 可以将地理数据写入到 Oracle 数据库并读出。 图 A2-3: GeoMedia 用户界面 3) GeoMedia WebMap 是 Intergraph 提供 的基 于因 特 网的空 间信 息发 布工 具。 它提供 了 多源数 据的 直接 访问 和发 布, 并且 支持 多种 浏览 器 。 GeoMedia WebMap Enterprise 除了能 够 在因特 网上 发布 数据 之外 , 还 提 供 了 空 间 分 析 服 务 , 如缓冲 区分 析、 路径 分析 、 地理编 码等 , 用户可 以在 客户 端通 过浏 览器提 出请 求 , 并 输 入 具 体参数 , 服 务 器 进 行 计 算 并将结 果返 回给 用户。 3. Mapinfo 产品系列 MapInfo 公司 于 1986 年 成 立于美 国特 洛伊 (Troy)市 , 成 立 以来, 该公 司一 直致力 于 提 供 先进的数据可视化、信息地图化技术,其软件代表是桌面地图信息系统软件— — MapInfo。 1) MapInfo Professional 是( 图 A2-4) MapInfo 公 司 主要的 软件 产品 ,它 支持 多种本 地 或者远 程数 据库 , 较 好 地 实现了 数据 可视 化 , 生 成 各种专 题地 图 。 此 外 还 能 够进行 一些 空间 查询和空间分析运算,如缓冲区等等,并通过动态图层支持 GPS 数据。 2) MapBasic 是为在 Mapinfo 平台 上开 发用 户定 制 程序的 编程 语言 ,它 使用 与 BASIC 语言一 致的 函数 和语 句, 便于用 户掌 握。 通过 MapBasic 进行 二次 开发 ,能 够 扩 展 MapInfo 功能,并与其它应用系统集成。 图 A2-4: MapInfo Professional 用户界面 3) MapInfo ProServer 是应用于 网络 环境下 的地 图应用 服务 器,它 使 得 MapInfo Professional 运行于服务器 端,并能够响应用户的操 作请求;而客户端可以使 用任何标准的 Web 浏览 器。 由于 在服 务 器上可 以运 行多 个 MapInfo Professional 实 例,以 满 足用户 的服 务 请求,从而节省了投资。 4) MapInfo MapX 是 MapInfo 提供的 OCX 控件。 5) MapInfo MapXtrem 是基于 Internet/Extranet 的地 图应用 服务 器, 它可 以用 于帮助 配 置企业的 Internet。 6) SpatialWare 是 在 对 象 — —关系 数据 库环 境下 基 于 SQL 进行空 间查 询和 分析 的空间 信 息管理 系统 , 在 SpatialWare 中, 支持 简单 的空 间对 象,从 而支 持空 间查 询, 并能产 生新 的 几何对 象。 在实 际应 用中 ,一般 使 用 SpatialWare 作 为数据 服务 器, 而 MapInfo Professional 作为客户端,可以提高系统开发效率。 7) Vertical Mapper 提供了基于网格的数据分析工具。 4.国产 GIS 软件 4. 1 MapGIS MapGIS(图 A2-5)是中国地质大学开发的地理信息系统软件,其功能模块包括: 1)数据输 入模块: 提 供 了 各种的空 间数 据输入 手段 ,包括数 字化 仪输入 ,扫 描矢量 化 输入以及 GPS 输入。 2)数据处 理模块: 可 以 对 点、线、 多边 形等多 种矢 量数据进 行处 理,包 括修 改编辑 、 错误检查、投影变换等功能。 3) 数据输出: 可以将编排好的图形显 示到屏幕或者输出到指定 设备上,也可以生 成 PostScript 或 EPS 文件。 4)数据转换: 提供了 MapGIS 与其它系统之间数据转换的功能。 5)数据库管理: 实现了对空间和属性数据库管理和维护。 6)空间分析 : 提供 了包括 DTM 分析 、空 间叠 加 分析、 网络 分析 等一 系列 空间分 析功 能。 7)图像处理: 图像配准镶嵌以及处理分析模块。 8)电子沙盘系统: 实时生成地形三维曲面。 9) 数字高程 模型 : 可 以 根 据离散 高程 点或 者等 高线 插值生 成网 格化 的 DEM, 并进行 相 应的分析,如剖面分析、遮蔽角计算等等。 图 A2-5: MapGIS 用户界面 4. 2 GeoStar CeoStar(吉 奥之星 )是 武汉 测绘 科技 大学开 发的 、面 向大 型数 据管理 的地 理信 息系 统 软件,其功能模块包括: 1) GeoStar:是 整个 系统的 基 本 模 块(图 A2-6) , 提供的 功能 包括 空间 数据 管理 、数 据 采 集 、 图 形 编 辑 、 空 间查询 分 析 、 专 题制 图和 符号设 计、 元数 据管 理等 , 从 而 支 持 从 数 据 录 入到制图输出的整个 GIS 工作流程。 图 A2-6: GeoStar 用户界面 2) GeoGrid :数字地形模型和数字正射影像的处理、分析模块。 3) GeoTIN:利 用离 散高 程点建 立 TIN,进 而插 值 得 到 DEM,并 进行 相关 分析 运 算 和 三维曲面生成。 4) GeoImager:可以进行遥感图像的处理和影象制图。 5) GeoImageDB:可以建立多尺度的遥感影象数据库系统。 6) GeoSurf:利用 Java 实现的因特网空间信息发布系统。 7) GeoScan:图像扫描矢量化模块,支持符号识别。 4.3 Citystar Citystar(城市之星 )地 理 信息系 统软 件由 北京 大学 开发研 制, 是一 个面 向桌 面应用 的 GIS 平台,其具体模块包括: 1) Citystar 编辑模块:矢量数据的录入、编辑。 2) Citystar 查询分析 模块 ( 图 A2-7) : 矢 量 栅 格 综 合 的 空间数 据管 理、 查 询 、 分 析模块 , 提供了多种空间模型运算。 3) Citystar 制图模块 : 提 供 了地图 的整 饰输 出以 及符 号制作 功能 , 同 时 也 可 以 制作影 象 地图。 4) Citystar 扫描矢量 化模 块: 提 供 了 线 状 图 形 扫描、 细化、 跟踪 并矢 量化 的一 系列操 作, 适用于地形图等高线的录入。 5) Citystar 可视开发模 块 : 包 括 OCX 控件, 使用 户 可以进 行二 次开 发。 该模 块提供 了 一个平 台 , 包 装 控 件的功 能, 便于 用户 使用 , 同 时 实现了 多源 数据 的管 理和 查询 , 使 用户 可 以方便的构造应用。 6) Citystar 遥感图像 处理 模块: 提供 了从 遥感 图像 纠正到 增强 、 变 换、 分 类 以提取 专题 信息整个流程的功能。 7) Citystar 数字地形模 块 :等值 线、 离散 点插 值生 成 DEM, 并基于 DEM 进 行各种 分 析。 8) Citystar 三维模块:基于 DEM 的三维曲面生成和查询分析。 9) Citystar GPS 模块: GPS 数据的接收、显示和分析。 图 A2-7: Citystar 用户界面 索引 “阶梯”地形(Terrace ) 3S(GIS,RS,GPS ) 9 交模型(9-Intersection Model ,9-IM ) BSP 树 BSP 树 C/A 码 C++语言 CELL 树 Delaunay 三角形 Dijkstra 算法 Douglas-Peucker 算法 Epsilon 带模型 IEEE 802 IKONOS 卫星 ISO/TC 211 标准 ISO/TC 211 地理信息/ 地球信息科学专业委 员会 ISO-9000 系列标准 Java 小应用(Java Applet ) Java 语言 KDB 树 K-D-B 树 Konigsberg 桥问题 NOAA 卫星(National Oceanic and Atmospheric Administration) OGC(OpenGIS Consortium ) P 码 R+树 RASIS 特性 RS-232 接口 R 树 Spaghetti 编码 SPOT 卫星( Systeme Probatoire d'Observation de la Terre) Voronoi 多边形 Web 服务器, WWW 服务器( Web Server, WWW Server) Zhang-Suen 细化算法 安装(Installation ) 八叉树 版本(Version ) 贝叶斯判别分析 被动遥感(Passive Remote Sensing ) 比较统计地图(Cartogram ) 比例尺(Scale ) 比率量(Ratio ) 边界代数算法( Boundary Algebra Filling, BAF) 边界内插方法 边缘检测(Edge Detection ) 变化传播(Change propagation ) 变换(Transformation ) 并发控制 并运算(Union ) 不规则三角网(Triangulated Irregular Network,TIN ) 不正规多边形(Weird Polygon) 采样(Sampling ) 彩色立方体(Color Cube ) 菜单(Menu ) 测距交会 测量(Survey ) 层次地形模型(Layer of Details ,LOD ) 层次分析法(Analytic Hierarchy Process , AHP) 层次模型(Layer Model ) 插件(Plug-ins ) 查询(Query ) 差分纠正 场模型(Field Model ) 超地图(Hyper-maps ) 超文本标志语言( Hypertext Markup Language,HTML ) 超文本传输协议( Hyper Text Transfer Protocol,HTTP ) 城域网(Metropolitan Area Network, MAN) 抽象数据类型( Abstract Data Type,ADT ) 传输控制协议( Transfer Control Protocol, TCP) 磁带(Tape ) 次序量(Ordinal ) 存储器(Memory ) 大规模集成(Large Scale Integration ,LSI ) 单点变换 单价法 倒排文件 等高线(Contour Line ) 等积投影 等角投影 等值线法 笛卡尔积(Cartesian Product ) 笛卡尔坐标系(Cartesian Coordinates ) 地理数据(Geospatial Data ) 地理信息建模系统( Geographic Information Modeling System,GIMS ) 地理信息科学( Geographical Information Science) 地理学(Geography ) 地貌晕渲图(Shaded Relief Map ) 地面控制点(Ground Control Point ,GCP ) 地球测量(Geomatics) 地球椭球体(Earth’s Ellipsoid ) 地球信息科学(Geo-information Science) 地球信息学(Geo-Informatics ) 地图符号(Symbol ) 地图学(Cartography ) 地形图(Topographic Map ) 地形图分幅(Sheet Line System ) 地性线 地震液化(Seismic Liquefaction ) 地址匹配(Address Match ) 点(Point ) 点方式(Point Mode ) 点集拓扑(Point Set Topology ) 点值法 点状符号(Point Symbol ) 叠加分析(Overlay ) 动态分段(Dynamic Segmentation) 动态数据交换( Dynamic Data Exchange, DDE) 动线法 度量关系 对地观测系统( Earth Observation System, EOS) 对象工厂(Object Factory ) 对象请求代理( Object Request Broker, ORB) 多边形(Polygon) 多光谱扫描仪(Multispectral Scanner, MSS) 二叉树(Binary Tree ) 二值图象(Binary Image ) 反电子欺骗(Anti-spoofing ,AS ) 范围法 方位关系 方位投影(Azimuthal Projection ) 仿射变换(Affine Transformation ) 非几何投影 非监督分类(Unsupervised Classification ) 费歇准则判别分析 分辨率( Resolution) 分布计算平台(Distributed Computing Platform,DCP ) 分布式 COM(Distributed COM ,DCOM ) 分布式系统(Distributed System ) 分类(Classification ) 分形(Fractal ) 辐射纠正 辅助存储器 付里曼码(Freeman Code ) 复数积分算法 覆盖(Coverage ) 概念世界(Conceptual World ) 甘特图(Gantt Chart ) 高程(Elevation) 高斯——克吕格投影 割投影 格网(Grid ) 各向同性表面(Isotropic Surface ) 各向同性场(Isotropic Field ) 各向异性场(Anisotropic Field ) 公共对象请求代理结构(Common object request broker architecture,CORBA ) 构件对象模型( Component Object Model, COM) 关键路径法(Critical Path Method ,CPM ) 关系模型(Relational Model ) 关系型数据库管理系统 (Relational Database Manage System,RDBMS ) 光盘(Compact Disc ,CD ) 广域网(Wide Area Network,WAN ) 归组(Grouping) 规则型铺盖(Regular Tesselations ) 国际标准化组织( International Standardization Organization,ISO ) 国家空间数据基础设施(National Spatial Data Infrastructure,NSDI ) 国家信息基础设施( National Information Infrastructure,NII ) 过程(Process ) 过滤和精化(Filter and Refine ) 合并(Union ) 合成孔径雷达(Synthetic Aperture Radar , SAR) 合同(Contract ) 弧(Arc ) 互操作(Interoperation ) 环境映象 缓冲区(Buffer Zone ) 基图修正模型( Base State with Amendments Model) 基因算法(Genetic Algorithm ) 极坐标系(Polar Coordinates) 集成电路(Integrated Circuit ,IC ) 集中式系统(Centralized System ) 几何纠正(Geometrical Correction ) 几何量算(Geometrical Measurement ) 几何体要素(Features with Geometry ) 几何投影 几何误差(Geometrical Error ) 计算机辅助软件工程(Computer-Aided Software Engineering CASE) 计算机辅助设计( Computer-Aided Design, CAD) 间隔量(Interval ) 兼容性(Compatibility ) 监督分类(Supervised Classification) 检索(Retrieval ) 简控(Monitor and Control ) 渐进采样(Progressive Sampling ) 交互操作(Interactive Operation ) 交通地理信息系统(GIS-T) 交通分析区(Traffic Analysis Zone ,TAZ ) 交运算(Intersect ) 角平分线法计算缓冲区 脚本(Scenario ) 接口描述语言(Interface Description Language,IDL ) 节点(Node ) 结点(Node ) 结构化(Structured ) 结构化查询语言( Structured Query Language,SQL ) 经度(Longitude ) 经线(Meridian) 精度(Precision) 局域网(Local Area NetworkLAN 矩阵(Matrix ) 距离(Distance) 距离倒数权重(Inverse-Distance Wighted ) 聚类(Cluster ) 聚类分析 聚类分析(Cluster Analysis ) 决策(Decision) 军事地理信息系统(MGIS ) 开放的地理数据存储接口(Open Geospatial Datastore Interface,ODGI ) 开放的地理数据互操作规范( Open Geodata Interoperation Specification,OpenGIS ) 开放系统互连模型(Open System Interconnect Reference Model,OSI ) 可持续发展(Sustanable Development ) 可扩展标记语言( Extensible Markup Language,XML ) 可视化(Visualization ) 克里金插值(Kriging Interpolation ) 客户机/ 服务器(Client/Server ,C/S ) 空间参照系(Spatial Reference ) 空间插值(Spatial Interpolation ) 空间定位 空间分辨率 Spatial Resolution 空间分析(Spatial Analysis ) 空间复杂度(Space Complexity ) 空间关联规则(Spatial Association Rule ) 空间划分(Spatial Tessellation ) 空间决策支持系统( Spatial Decision Support System,SDSS) 空间模型(Spatial Model ) 空间认知(Spatial Cognition ) 空间事务处理系统( Spatial Transaction Process System,STPS ) 空间数据融合(Spatial Data Fusion ) 空间数据挖掘(Spatial Data Mining ) 空间数据转换标准( Spatial Data Transfer Standard,SDTS ) 空间索引(Spatial Index ) 空间信息管理系统(Spatial Management Information System,SMIS ) 空间自相关(Spatial Autocorrelation ) 块码(Block Code ) 雷达(Radar ) 离散余弦变换( Discrete Cosine Transformation,DCT ) 里程碑(Milestone ) 立体像对(Stereo Images ) 连接(Join ) 联邦空间数据库( Federated Spatial Database) 联系(Relationship ) 链(Chain) 链码(Chain Code) 邻接矩阵 邻近度(Proximity ) 邻域变换 领域工程(Domain Engineering ) 领域特定的软件体系结构(Domain-Specific Software Architecture,DSSA ) 令牌环网(Token Ring Network ) 浏览器(Browser ) 流方式(Stream Mode ) 陆地卫星(Landsat ) 滤波 逻辑误差(Logical Error ) 螺旋模型 曼哈顿距离(Manhattan Distcance) 美国联邦地理数据委员会(FGDC ) 面向对象(Object Oriented ) 面向对象的编程语言(OOPL ) 面向对象的分析(OOA) 面向对象的设计(OOD) 面向对象的数据库管理系统(OO-DBMS ) 面状符号(Area Symbol ) 命令行(Command Line ) 命名量(Nominal ) 模糊集(Fuzzy Set ) 模糊集(Fuzzy Set ) 模式(Schema ) 模式识别(Pattern Recognition ) 模型(Model ) 模型库(Model Base ) 内部点扩散算法 内部点扩散算法 内部互连网(Intranet ) 内部模式(Internal Schema ) 内营力 能力成熟度模型( Capability Maturity Model for Software,CMM ) 欧拉函数(Euclidean Function ) 欧拉数 欧氏距离(Euclidean Distance ) 判别分析 培训(Training ) 配置管理(Configuration Management ) 喷泉模型 平滑(Smoothing ) 平面图形(Planar Graph) 平面直角坐标系 平移(Translation ) 评估(Evaluation ) 坡度(Slope ) 坡向(Aspect ) 瀑布模型(Waterfall Model ) 启发丢弃法(Drop Heuristic ) 前向恢复 墙纸法(Wall Paper Method ) 切投影 区域变换 区域信息系统(Regional GIS) 趋势面(Trend Surface ) 全球变化(Global Change ) 全球定位系统( Global Positioning System, GPS) 全球横轴墨卡托投影( Universal Trasverse Mercator Projection,UTM Projection ) 人工智能(Artificial Intelligence ,AI ) 人机交互界面(User Interface ,UI ) 任意投影 容错性(Error Tolerance ) 冗余磁盘阵列(Redundant Arrays of Inexnensive,RAID ) 软件工程(Software Engineering) 软件过程(Software Process ) 软件危机(Software Crisis) 软件维护 软盘(Floppy Disk ) 三层结构(Three-tied Architecture ) 扫描(Scan ) 扫描算法 上溯法 设计模式(Design Pattern ) 射线算法 生命周期(Lifecycle ) 时间复杂度(Time Complexity ) 时态地理信息系统(Temporal GIS) 实体(Entity ) 实体关系模型(Entity-Relatioship Modal) 矢量(Vector ) 矢量化(Vectorization ) 事务(Transaction ) 手扶跟踪数字化(Manual Digitising ) 树(Tree ) 树状索引编码 数据仓库(Data Warehouse) 数据操纵语言(Data Manipulation Language , DML) 数据定义语言 Data Definition LanguageDDL 数据共享(Data Sharing ) 数据互操作(Data Interoperation ) 数据结构(Data Structure ) 数据库管理系统( Data Base Management System,DBMS ) 数据类型(Data Type ) 数据流图(Data-Flow Diagram ,DFD) 数据手套(Digital Glove ) 数据质量(Data Quality ) 数字表面模型( Digital Surface Model , DSM) 数字地球(The Digital Earth ,DE ) 数字地形模型( Digital Terrain Model, DTM) 数字高程模型(Digital Elevation Model , DEM) 数字化仪(Digitiser ) 双边界搜索算法( Double Boundary Direct Finding,DBDF ) 双重独立坐标地图编码(Dual Independent Map Encoding,DIME ) 顺序文件(Sequential File ) 四叉树(Quadtree) 算法(Algorithm ) 随机存取存储器( Random Access Memory, RAM) 碎屑多边形(Sliver Polygon ) 缩放(Scale Change ) 索引文件 泰森多边形(Thiessen Polygon) 体元(Voxel ) 通视分析(Visibility Analysis ) 通用网关接口( Common Gateway Interface, CGI) 统计图法 统一建模语言( Unified modeling language, UML) 统一资源定位器( Uniform Resource Locator,URL ) 投影(Projection ) 凸角圆弧法计算缓冲区 图(Graph ) 图例(Legend) 图形拼接 图形用户界面( Graphical User Interface, GUI) 土地信息系统(Land Information System , LIS) 拖放(Drag and Drop) 拓扑关系(Topological Relation ) 拓扑生成(Build Topology ) 外部模式(External Schema ) 外围设备(Peripheral Equipment ) 外营力 万维网(World Wide Web ,WWW) 万维网地理信息系统(WebGIS ) 网际互联协议(Internet Protocol ,IP ) 网络(Network ) 网络分析(Network Analysis ) 网络模型(Network Model ) 微分圆 维护 伪节点(Pseudo Node) 纬度(Latitude ) 纬线(Parallel ) 谓词(Predicate ) 文件传输协议(File Transfer Protocol , FTP) 无比例尺 误差(Error ) 误差带模型 系统设计(System Design ) 细化(Thin ) 下溯法 下载(Download ) 现象(Phenomenon) 线(Line ) 线性规划(Linear Programming ) 线状符号(Line Symbol ) 相关上下文(Context ) 项目(Project ) 象素联接数 小波变换(Wavelet Transformation ) 协议(Protocol ) 信息(Information ) 信息团体(Information Community ) 信息系统(Information System ) 虚拟地理环境(Virtual Geographic Environment,VGE ) 虚拟现实(Virtual Reality ,VR ) 需求分析(Requirement Analysis ) 需求建议书(Request for Proposal ,RFP ) 许可(Licence ) 序列快照模型(Sequent Snapshots Model ) 悬挂节点(Dangling Node ) 旋转(Rotation ) 选择(Selection ) 选择可用性 Selective AvailabilitySA 训练区(Training Area ) 研制与开发(Research and Development , R&D) 演化模型 样条函数(Spline Function ) 遥感(Remote Sensing ,RS ) 遥感平台(Remote Sensing Platform ) 遥感器(Remote Sensor ) 要素(Feature ) 要素模式(Feature Schema ) 要素模型(Feature Model ) 要素注册(Feature Registry ) 一致性(Consistent ) 依赖性(Dependency ) 移动平均插值 以太网(Ethernet ) 因特网(Internet ) 应用编程接口( Application Programming Interface,API ) 硬盘(Hard Disk ) 用例(Use Case ) 游标(Puck ) 游程长度编码(Run-Length Codes ,RLC) 有向图(Digraph ) 语义(Semantics) 域名(Domain Name ) 阈值(Threshold) 元胞(Cell ) 元胞自动机(Cellular Automata ,CA ) 元数据(Metadata ) 元组(Tuple ) 原型(Prototype ) 原子性(Atomic ) 圆柱投影(Cylindrical Projection ) 圆锥投影(Conical Projection ) 远程过程调用( Remote Procedure Call, RPC) 约束(Constraint ) 再分类(Reclassification ) 增强(Enhancement ) 栅格(Raster ) 知识库(Knowledge Base ) 只读存储器(Read Only Memory ,ROM ) 指挥,控制,通信,情报(C3I ) 制图模型(Cartographic Model ) 制图综合(Map Generalization ) 质底法 质心(Centroid ) 中央处理单元 Central Processing UnitCPU 重要点(Very Improtance Point ,VIP ) 主成分分析( Principal Component Analysis, PCA) 主成分分析( Principal Component Analyst) 主动遥感(Active Remote Sensing ) 注记 专家系统(Expert System ,ES ) 专题地理信息系统(Thematic GIS ) 专题制图仪(Thematic Mapper ,TM ) 准确性(Accuracy ) 资源分配 自动制图/ 设施管理( Automated Mapping/Facilities Management , AM/FM) 族系跟踪(Lineage Tracking ) 最大均方误差( Root of Maximum Standard Error) 最短路径 最佳路径 最小外包矩形(Minimum Bounding Rectangle,MBR ) 坐标几何体(Features with Geometry ) 坐标系(Coordinates ) 参考文献 1.书和专著 [德]阿.赫特纳(王兰生译),地理学——它的历史、性质和方法,1997,北京:商务印 书馆 [俄]K.A. 萨里谢夫(李道义译),地图制图学概论,1982,北京:测绘出版社 [美]A. H. 罗宾逊,R. D.塞尔,J.L.莫里逊,P.C.墨尔克(李道义、刘耀珍译) ,地图 学原理,1989,北京:测绘出版社 [美]D.J.沃姆斯利、G.J.刘易斯(王兴中、郑国强、李贵才译),行为地理学导论,1988, 西安,陕西人民出版社 [美]R.哈特向(黎樵译),地理学性质的透视,1997,北京:商务印书馆 [美]T.哈默格兰(曾增强译),数据仓库技术,1998,北京:中国水利水电出版社 [美]丹尼斯.伍德(王志弘、李根芳、魏庆嘉译),地图的力量,2000,北京:中国社会 科学出版社 [美]杰克.吉多、詹姆斯.P.克莱门特(张金成译),成功的项目管理,1999,北京:机 械工业出版社 [美]尼葛洛庞帝(胡泳、范海燕译),数字化生存,1997,海口:海南出版社 [日]遥感研究会(刘勇卫、贺雪鸿译),遥感精解,1993,北京:测绘出版社 [英]大卫.哈维(高泳源、刘立华、蔡运龙译),地理学中的解释,1996,北京:商务印 书馆 Andrej Vckovski, Interoperatable and Distributed Processing in GIS, 1998, London: Taylor & Francis Andrew S. Tanenbaum,Computer Networks,1996,北京清华大学出版社 Andrew S. Tanenbaum,Distributed Operating Systems,1996,北京清华大学出版 社 C. Dana Tomlin,Geographic Information Systems and Cartographic Modeling,1990, Englewood Cliffs,New Jersey:Prentice-Hall Inc. Christopher B. Jones, Geographical Information Systems and Computer Cartography,1997, Addison Wesley Longman Ltd. D.R.F. Taylor, Policy Issues in Modern Cartography, 1998, Oxford: Elsevier Science Ltd Grady Booch,Object-Oriented Analysis and Design with Applications,1994,Redwood City,CA:The Benjamin/Cummings Publishing Company,Inc. Hilary M. Hearnshaw & Divid J. Unwin,Visualization in Geographical Information Systems,1994,Chichester:John Wiley & Sons Ian Masser,Harlan J. Onsrud,Diffusion and Use of Geographic Information, Dordrecht, 1992,Kluwer Academic Publishers Jeffrey D. Ullman & Jennifer Widom, A First Course in Database Systems, 1998, 北京:清华大学出版社 Jonathan Raper,Three Dimensional Applications in Geographical Information Systems,1989,London: Taylor & Francis Kenneth R. Castleman, Digital Image Processing, 1998,北京:清华大学出版社 Leung, Yee,Intelligent Spatial Decision Support Systems. 1997,Berlin: Springer M. Birkin , G. Clarke , M. Clarke & A Wilson , Intelligent GIS , Location Decisions and Strategic Planning , 1996, Cambridge, GeoInformation International M.F.Goodchild & D.W.Rhind, Geographical Information Systems: Principles and Applications. 1991,London: Longman Manfred M. Fischer & Peter Nijkamp,Geographic Information Systems, Spatial Modelling and Policy Evaluation,Berlin:Springer-Verlag Marc van Kreveld, Jurg Nievergelt, Thomas Roos & Peter Widmayer, Algorithmic Foundation of Geographic Information Systems, 1997, Berlin:Springer Martien Molenaar, An Introdcution to the Theory of Spatial Object Modelling, 1998, London:Taylor & Francis Ltd. Massimo Craglia & Harlan Onsrud, Geographic Information Research: Trans-Atlantic Perspectives ,1999, Bristol:Taylor & Francis Michael F. Worboys, GIS : A Computing Perspective ,1995,London:Taylor & Francis Ltd. Michael N. DeMers, Fundamentals of Geographic Information Systems,1997,New York:John Wiley & Sons Inc. Michael Stonebraker & Dorothy Moore(杨冬青、唐世渭、裴芳译),对象-关系数据 库管理系统——下一个浪潮,1997,北京:北京大学出版社 Michel Scholl & Agnes Woisard ,Advances in Spatial Databases,1997,Berlin: Springer Nabil R. Adam & Aryya Gangopadhyay, Database Issues in Geographic Information Systems, 1997, Dordrecht: Kluwer Acadamic Publishers P. van Oosterom, Reactive Data Structure for Geographic Information Systems, 1993, New York: Oxford University Press. P.A.Buffough & R.A. McDonnel, Principles of Geographical Information Systems, 1998, New York: Oxford Press P.A.Buffough, Principles of Geographical Information Systems for Land Resource Assessment,1986, Oxford: Clarendon Press Peter Coad & Edward Yourdon(邵维忠、廖钢城、李力译),面向对象的分析,1992, 北京,北京大学出版社 Peter Coad & Edward Yourdon(邵维忠、廖钢城、李力译),面向对象的设计,1992, 北京,北京大学出版社 Robert Lloyd, Spatial Cognition, 1997, Dordrecht: Kluwer Acadamic Publishers S.Fotheringham & P.Rogerson, Spatial Anaysis and GIS,1994,Lodon:Taylor and Francis Samet H.. Applications of spatial data structure. Computer Graphics, Image Processing , and GIS, Massachusetts :Addison-Wesley Publishing Company, Inc. , 1994. Samet H.. The design and analysis of spatial data structure . Massachusetts: Addison-Wesley Publishing Company, Inc. , 1990. Stewart Fortheringham & Peter Rogerson,Spatial Analysis and GIS,1994, London:Taylor & Francis Ltd. Timothy W. Foresman, The History of Geographic Information Systems: Perspectives from the Pioneers, 1997,Englewood Cliffs,New Jersey:Prentice-Hall Inc. Tor Bernhardsen,Geographic information systems : an introduction,1999,New York : Wiley Wolfram, Stephen,Theory and applications of cellular automata,1986,Singapore, World Scientific Zhou Qiming,Li Zhilin,Lin Hui&Shi Wenzhong, Spatial Information Technology Towards 2000 and Beyond,1998,Berkeley:CPGIS 边馥苓,地理信息系统原理和方法,1996,北京,测绘出版社 陈俊、宫鹏,实用地理信息系统——成功地理信息系统的建设与管理,1998,北京:科 学出版社 陈述彭、鲁学军、周成虎,地理信息系统导论,1999,北京:科学出版社 承继成、李琦、易善桢,国家空间信息基础设施与数字地球,1999,北京:清华大学出 版社 崔伟宏,空间数据结构研究,1995,北京:中国科学技术出版社 崔屹,图像处理与分析——数学形态学方法及应用,2000,北京:科学出版社 杜道生、陈军、李征航,RS GIS GPS的集成与应用,1995,北京:测绘出版社 宫鹏,城市地理信息系统:方法与应用,1996,Berkeley:CPGIS 宫鹏、史培军、浦瑞良、郭华东,对地观测技术地球系统科学,1996,北京:科学出版 社 龚健雅,当代GIS的若干理论与技术,1999,武汉:武汉测绘大学出版社 郭德方,遥感图像的计算机处理和模式识别,1987,北京,电子工业出版社 郭仁中,空间分析,2000,武汉:武汉测绘大学出版社 胡毓钜、龚剑文、黄伟,地图投影,1981,北京:测绘出版社 黄杏元、汤勤,地理信息系统概论,1990,北京:高等教育出版社 科技部国家遥感中心,地理信息系统与管理决策,2000,北京:北京大学出版社 李德仁、龚健雅、边馥苓,地理信息系统导论,1993,北京:测绘出版社 南京大学、北京大学、中山大学、西北大学地理系,测量学与地图学,1979,北京:人 民教育出版社 齐东旭,分形及其计算机生成,1994,北京:科学出版社 邵维忠、杨芙清,面向对象的系统分析,1998,北京:清华大学出版社 史文中,空间数据误差处理的理论与方法,1998,北京:科学出版社 宋小冬、叶嘉安,地理信息系统及其在城市规划与管理中的应用,1995,北京:科学出 版社 孙铁成,计算机与法律,1998,北京:法律出版社 王长耀、郑兴年、崔伟宏等,资源环境动态遥感与模型分析试验研究,1993,北京:宇 航出版社 王立福、张世琨、朱冰,软件工程——技术、方法与环境,1997,北京:北京大学出版 社 王桥、毋河海,地图信息的分形描述与自动综合研究,1998,武汉:武汉测绘大学出版 社 邬伦、任伏虎、谢昆青、程承旗,地理信息系统教程,1994,北京:北京大学出版社 徐绍铨、张华海、杨志强、王泽民,GPS测量原理及应用,1998,武汉:武汉测绘大学 出版社 严蔚敏、吴伟民,数据结构,1992,北京:清华大学出版社 阎正,城市地理信息系统标准化指南,1998,北京:科学出版社 杨东援,交通规划决策支持系统,1997,上海:同济大学出版社 应明,计算机软件的版权保护,1991,北京:北京大学出版社 张超、陈丙咸,地理信息系统,1995,北京:高等教育出版社 张海藩,软件工程导论,1998,北京:清华大学出版社 张力果、赵淑梅、周占鳌,地图学,1990,北京:高等教育出版社 张永生,遥感图像信息系统,2000,北京:科学出版社 中国21世纪议程管理中心,中国地理信息元数据标准研究,1999,北京:科学出版社 周成虎,孙战利,谢一春,地理元胞自动机研究,1999,北京:科学出版社 周成虎、骆剑承、杨晓梅、杨存建、刘庆生,遥感影像地学理解与分析,1999,北京: 科学出版社 周培德,计算几何——算法分析与设计,1999,北京:清华大学出版社 周忠谟、易杰军、周琪,GPS卫星测量原理与应用,1991,北京:测绘出版社 2.标准和规范 Capability Maturity Model SM for Software, Version 1.1,1993,CMU-SEI OpenGIS ? Simple Features Specification For OLE/COM, Revision 1.1, 1999, Open GIS Consortium, Inc. The OpenGIS? Abstract Specification, Version 4, 1999, Open GIS Consortium, Inc. OMG Unified Modeling Language Specification,Version 1.3,1999,Object Management Group Inc. The Common Object Request Broker:Architecture and Specification,Version 2.1, Object Management Group Inc. ISO/TC 211 Geographic Information/Geomatics,1998,ISO 3.杂志 Int. J. Geographical Information Science Cartography and Geoghraphic Information 地理科学进展 地理学报 武汉测绘科技大学学报 测绘学报 遥感学报 Int. J. Remote Sensing Photogrammetric Engineering and Remote Sensing 4.Website http://www.esri.com http://www.mapinfo.com http://www.opengis.org http://www.statkart.no/isotc211/ http://www.intergraph.com http://www.vtouris.com http://abbott.ccm.emr.ca http://www.gisworld.com http://www.spaceimage.com 5.论文 A. Sheth & J. Larson, Federated database systems for managing distributed, heterogeneous, and autonomous databases. ACM Computing Surveys, 1990, 22(3). Brinkhoff T. and Kriegel H. P. et al. Multi-step processing of spatial joins. In the processing of the ACM SIGMOD International Conference on Management of Data, Minneapolis MN,1994 Buffough,P.A,Development of Intelligent Geographical Information Systems, Int. J. of Geographical Information Systems, 1992,6 David M. Mark & Max J. Egenhofer, Modeling Spatial Relations Between Lines and Regions: Combining Formal Mathematical Models and Human Subject Testing, Cartography and Geographic Information Systems, 1995, 21(4) Elisabeth S. Nelson , A Cognitive Map Experiment : Mental Representation and the Encoding Process, Cartography and Geographic Information Systems, 1996, 23(4) Eric Sheppard, GIS and Society: Towards a Research Agenda, Cartography and Geographic Information Systems, 1995, 22(1) G. Alonso & C. Hagen, Geo-Opera: Workflow Concepts for Spatial Processes, In the proceeding of Advances in Spatial Databases,1995 Georg Kosters, Bernd-uwe Pagel, & Hans-werner Six, GIS-application Development with GeoOOA, Int. J. Geographical Information Science, 1997,11(4) I. D. Moore, R. B. Grayson & A. R. Ladson, Digital Terrain Modelling: A Review of Hydrological Geomorphological and Biological Application, Hydrological Processes, 1991,5 J. C. Hinter, GIS and Remote Sensing Integration for Environmental Applications, Int. J. Geographical Information Systems, 1996,10(7) J. Fairfield & P. Leymarie,Drainage Networks from Grid Digital Elevation Models,Water Resource Research,1991,27 K. Koperski, & J. Han, Discovery of Spatial Association Rules in Geographic Information Databases. In the proceeding of Advances in Spatial Databases,1995 L. E. Band, Topographic partitioning of watersheds with digital elevation models,Water Resources Research, 1986,22 M.P. Amstrong, & P.J.Densham, Database orgnazation strategies for spatial decision support systems, Int. J. of Geographical Information Systems, 1990,4 Oliver Gunther & Volker Gaede, Oversize Shelves: a Storage Technique for Large Spatial Data Objects, Int. J. Geographical Information Science, 1997,11(1) Stefanakis E.,et al. Point representation of spatial objects and query window extension: a new technique for spatial access methods. International Journal Geographical Information Science, 1997, 11(6) V.B. Robinson & A.U. Frank, Expert Systems for Geographical Information Systems, Photogrammetric Engineering and Remote Sensing, 1987,53 Yuemin Ding & Paul J. DENSHAM, Spatial Strategies for Parallel Spatial Modelling, Int. J. of Geographical Information Systems, 1996,10(6) 陈常松、何建帮,面向GIS数据共享的概念模型设计研究,遥感学报,1999,3(3) 陈友飞、许世远,因特网上的地理学资源及其开发,地理学报,1999,54(3) 戴洪磊、吴守荣、徐泮林、郭金运,GIS中平面线位误差带的可视化表达,中国图像图 形学报,1999,4(3) 邸凯昌、李德仁、李德毅,空间数据发掘和知识发现的框架,武汉测绘科技大学学报, 1997,22(4) 龚建华、林辉、肖乐斌、谢传节,地学可视化探讨,遥感学报,1999,3(3) 韩海洋、龚建雅、袁相儒,Internet 环境下用 Java/JDBC 实现地理信息的互操作与分 布式管理及处理,测绘学报,1999,28(2) 黄波、 林辉, GeoSQL:一种可视化空间扩展SQL查询语言, 武汉测绘科技大学学报, 1999, 24(3) 黎夏、叶嘉安,约束性单元自动演化CA模型及可持续城市发展形态的模拟,地理学报, 1999,54(7) 李德仁,信息高速公路、空间数据基础设施与数字地球,测绘学报,1999,28(1) 李德仁、关泽群,将 GIS 数据直接纳入图像处理,武汉测绘科技大学学报,1999,24 (3) 鲁学军、周成虎、龚建华,论地理空间形象思维,地理学报,1999,54(5) 闾国年、钱亚东、陈钟明, 基于栅格数字高程模型提取特征地貌技术研究,1998,地 理学报,53(6) 齐清文、张安定,论地图学知识创新体系的构建,地理科学进展,1999,18(1) 王晓栋、崔伟宏,数字地球的时空维实现,地理学报,1990,18(2) 王之卓,从测绘学到Geomatics,武汉测绘科技大学学报,1998,23(4) 杨群、阎国年、陈钟明,地理信息数据仓库的技术研究,中国图像图形学报,1999,4 (8) 余生晨、刘大有、刘洪,山脊线与山谷线的计算机自动检测,中国图像图形学报,1999, 4(8) 袁相儒、龚建雅、林辉、陈莉丽,异构地理信息处理环境互操作的Internet GIS方法, 武汉测绘科技大学学报,1999,24(3) 张保钢、朱波、朱光,GIS中位置信息的通用数据质量模型及其质量控制,武汉测绘科 技大学学报,1999,24(2) 张新生、何建邦,城市空间增长与土地开发时空格局,遥感学报,1997,1(2)