土
地
信
息
系
统
四川农业大学 资源环境学院
土
地
信
息
系
统
内容简介
§ 4.1 概述
§ 4.2 空间数据库模型
§ 4.3 空间数据库设计
§ 4.4 数据库管理系统
§ 4.5 数据库系统的建立与维护
土
地
信
息
系
统
§ 4.1 概述
4.1.1 数据库在土地管理信息系统中的地
位与作用
土地信息数据花费的时间要占整个管理系统建
设所花时间的 85%以上。
贮存于数据库中的空间数据和属性数据是土地
管理信息系统的基础。
土地信息数据库是数据库在土地管理方面的应
用。
土
地
信
息
系
统
① 数据库 是数据组织和存储的高级形式,是具
有特定联系的多种类型的记录集合。其数据组织
常分为 字段、记录、文件和数据库 四级。
4.1.2 数据库及其相关概念
字段 是可以定义数据的最小单位,也叫基本项
或数据项等。
记录 是应用程序输入 — 输出的逻辑单位,是关
于一个实体的数据总和,构成该记录的字段表示
实体的若干属性。
土
地
信
息
系
统
文件 是一给定类型的记录的全部具体值的集合
。根据记录的组织方式和存取方法可以分为 顺序
文件、随机文件、索引文件和倒排文件 等。
数据库 是集中、统一地保存和管理某一信息系
统或某一领域内有用信息数据的计算机系统。数
据库的内部构造是文件的集合,这些文件之间存
在某种联系,不能孤立存在。
4.1.2 数据库及其相关概念 (续 )
土
地
信
息
系
统
4.1.2 数据库及其相关概念(续)
② 数据库管理系统 是提供数据库建立、使用和
管理工具的软件系统。
③ 空间 数据库管理系统 是指能够对存储的地理
空间数据进行语义和逻辑的定义,提供必需的空
间数据查询检索和存取功能,以及能够对空间数
据进行有效的维护和更新的一套软件系统。
④ 数据库应用系统 是由土地信息系统的空间分
析模型和应用模型所组成的软件。
土
地
信
息
系
统
4.1.3 数据库特征
空间数据库与一般数据库相比,具有以下
特点,
①数据量特别大 。
② 不仅有地理要素的属性数据,还 有大量
的空间数据 。
③数据应用广泛 。例如地理研究、环境保
护、土地利用与规划、资源开发、生态环境、
市政管理、道路建设等。
土
地
信
息
系
统
SPARC分级结构
SPARC是美国国家标准协会
(ANSI)下属的标准规划和要求委
员会的缩称。这一模型将数据库
划分为 内模式、概念模式和外模
式 三级,被称为 SPARC模型 。
4.1.4 数据库的分级结构
土
地
信
息
系
统
① 内模式 (internal schema) 存储模式,
它是当数据库在外存储器 (例如磁盘 )
上存储时,对它的物理结构的描述。
② 概念模式 (conceptual schema)
它是对数据库整体逻辑结构的描述。
土
地
信
息
系
统
③ 外模式 (external schema) 每一外
模式都是概念模式的一个子集,包涵
了允许某一特定用户使用的那部分数
据。外模式就是用来定义满足不同用
户(例如地籍规划、地价评估等)需
要的数据库。一个数据库只能有一个
概念模式,但却允许有多个外模式。
4.1.4 数据库的分级结构(续)
土
地
信
息
系
统
图 4.1 SPARC分级结构
应用程序
外模式 A 用户视图 (用户级
逻辑数据库 )
外部 / 概念映射
概念模式
应用程序 应用程序
外模式 B
概念 / 内部映射
DBA视图(全局逻
辑数据库)
系统程序员视图
(物理数据库)
模 内 式
DBMS
土
地
信
息
系
统
顺序文件 (Sequential File) 顺序文件是按记录
进入文件的先后顺序存放的, 它的逻辑顺
序和物理顺序是一致的 。
直接存取文件 (Direct AccessFile) 也称随机文件
、散列文件或 Hash文件。该文件采用关键字
变地址方法组织文件。通过建立一个 Hash函
数 i= H(k)(k为关键字,i为地址 )把关键字转
换成地址,然后把记录存贮到相应的地址
中。
4.1.5 常用的数据文件
土
地
信
息
系
统
索引文件 带有索引的文件称为索引文件,
索引就是码 k与相应记录 Rk的地址 A(Rk)的
对应表 。
倒排文件 是按照记录的主关键字来构造
索引的,因此也叫做主索引。如果按照一
些辅关键字来组织索引,则称为辅索引,
带有这种辅索引的文件就称为倒排文件。
4.1.5 常用的数据文件 (续 )
土
地
信
息
系
统
在土地信息存取中,常常不仅要按照
关键属性 (如土壤类型 )来提取数据,同
时还需要一些相关联的属性,如土层
厚度、土壤质地,pH值、坡度和土壤
侵蚀状况等。这时为提高查找效率,
缩短响应时间,需要仔细分析辅关键
字以建立一组辅索引,即分别按土层
厚度等 5项土壤性质建立索引。
土
地
信
息
系
统
表 4.1 土壤类型文件
土壤类型
(主关键字)
土层厚
度
质地
pH
坡度
侵蚀程
度
灰冲积水稻土
70-100
轻壤
7.1-7.6
0-2
轻微
潮沙土
35-50
砂土
6.8-7.4
2-6
轻微
老冲积黄泥土
50-75
重壤
5.1-5.8
6-13
严重
红紫泥土 27-50
砂壤
4.6-5.5
12-20
严重
暗紫泥
50-74
粘土
7.4-8.3
7-15
中度
土
地
信
息
系
统
空间数据模型有四种,层次模型、网络
模型、关系模型和面向对象模型 。
根据使用的模型,可以把数据库分成:
层次型数据库, 网络型数据库, 关系型
数据库 和 面向对象数据库 。
§ 4.2 空间数据库模型
土
地
信
息
系
统
4.2.1 层次模型 是按层次结构来组织
数据的 。 因此, 层次结构也叫树形结
构, 树中的每个结点代表一种实体类
型 。 这些结点应满足,
① 有且仅有一个结点无双亲, 这个结点称
为根结点;
② 其它结点有且仅有一个双亲结点 。
土
地
信
息
系
统
林地
有林地 灌木林地 疏林地 未成林地 苗圃 … …
经
济
林
… … 竹
林
人工林 天然林
特
用
林
用
材
林
图 4.2 层次型数据模型
土
地
信
息
系
统
4.2.2 网络模型 在网状模型中,允许,
①一个坐标结点可以有多个双亲结点,因为
一个结点可能属于多条弧段,而一个双亲结
点有两个子女结点,即一条弧段总有两个结
点;
②一个图斑双亲结点有多个弧段子女结点,
而一个弧段子女结点同时又属于两个图斑双
亲结点。
土
地
信
息
系
统
4.2.3 关系模型 在关系模型中,实
体及实体间的联系归结为满足一定条
件的二维表。
?二维表中存放了实体本身的数据和
实体间的联系两类数据。
土
地
信
息
系
统
图 4.3 空间数据表示实例
(210.00,164.00)
303
305
306
弧段 1
弧段 2
304
(205.00,104.00)
(134.00,240.00)
1
2 3
103
Y
X
土
地
信
息
系
统
(a) 坐标点数据表
表 4.2 关系型数据模型实例
点编码
注释
X
Y
1
104
205
2
127
213
3
127
213
,
,
,
,
63
134
240
103
土
地
信
息
系
统
(b) 弧段坐标点锁引表
表 4.2 关系型数据模型实例
弧段
编码
起点
编码
终点
编码
左图
斑
右图
斑
X
mi
n
X
ma
x
Y
mi
n
Y
ma
x
1
1
2
303
305
10
4
12
7
20
5
21
3
2
3
103
304
305
12
7
14
4
21
3
25
0
,
,
,
,
,
,
,
,
,
土
地
信
息
系
统
① 表存放对 实体(坐标点) 的描述,如点编
码,X,Y坐标等信息 ;
② 表存放对 实体(弧段) 的描述,如弧段编
码、起点编码、终点编码、左区域、右区
域、包络矩形等信息。
表 4.2中的两个表可简单地表示 弧段与点
之间的关系,
土
地
信
息
系
统
关系模型的特点,
①结构单一化;
②关系模型是在严格的关系代数的基础
上进行的。
③具有结构简单灵活、数据修改和更新
方便、容易维护和理解等优点,是当前
数据库中最常用的数据模型。
4.2.3 关系模型 (续 )
土
地
信
息
系
统
问题,
在效率、数据语义、模型扩充、程序交
互和目标标识方面部还存在一些问题,
待别是在处理空间数据库所涉及的复杂
目标方面,传统关系模型显得难以适应
。
土
地
信
息
系
统
4.2.4 面向对象模型
对象 是客观事物实体的部分或整体的数字
表达。每个对象都有自己的特征和行为,
对象的特征用数据来表示,称作 对象的属
性 ;对象的行为用对象中的代码来实现,
称作 对象的方法 。
土
地
信
息
系
统
面向对象 是指无论怎样复杂的事物都可以
准确地由一个对象表示,这个对象是一个
包含了数据集和操作集的实体。
?除数据与操作的封装性以外,面向对象
的数据模型还涉及到 分类、概括、聚集和
联合 四个概念以及继承和传播两个语义模
型工具。
土
地
信
息
系
统
表 2-4-1 三种常用的数据模型比较 表 4.3 三种常用传统数据模型的比较
土
地
信
息
系
统
§ 4.3 空间数据库设计
4.3.1 空间数据库设计的原则
尽量减少空间数据的冗余性
提供稳定的空间数据结构
支持多种多样的决策需要,具有较强的
应用适应性
土
地
信
息
系
统
满足用户对空间数据及时访问的需求,
并高效提供用户所需的空间数据查询结
果
在数据元素间维持复杂的联系,反映空
间数据的复杂性
土
地
信
息
系
统
传统的数据库设计过程,
系统需求分析 ?逻辑设计 ?物理设计
流行的数据库设计过程,
图 4.4 数据库设计过程及其文档
系统需求分析
概念设计
实现设计
物理设计
需求说明书
E— R 模型
逻辑数据库结构
物理数据库结构
4.3.2 空间数据库设计过程
土
地
信
息
系
统
4.3.2.1 需求分析 是整个空间数据库 设计与
建立 的基础,
?① 调查用户需求,了解用户特点和要求,
取得设计者与用户对需求的一致看法 。
土
地
信
息
系
统
?② 需求数据的收集和分析, 包括信息需
求 (信息内容、特征、需要存储的数据 )、
信息加工处理要求 (如响应时间 )、完整性
?③编制用户需求说明书, 包括需求分析
的目标、任务、具体需求说明、系统功能
与性能、运行环境等,是需求分析的最终
成果。
土
地
信
息
系
统
4.3.2.2 概念设计 是将需求说明书中关于
数据的需求,综合为一个统一的概念模型。
图幅理论面积 控制 行政单位块面积
( a) 两个实体间的联系
控
制
图斑 行政单位块面积
图 4.5 用 E— R法表示实体或联系的属性
土
地
信
息
系
统
首先根据单个应用的需求,用实体 — 联系法
(简称 E— R法)画出能反映每一应用需求的
局部 E- R模型。然后把这些 E- R图合并起
来,消除冗余和可能存在的矛盾,得出系统
的总体 E- R模型。图 4.5是用 E— R法画出的
土地资源资源信息数据库的部分实体与联系
有局部 E— R图。图中矩形框、菱形框和椭圆
形框分别表示 实体、联系和属性 。
**
土
地
信
息
系
统
图斑 图斑号
地类号 毛面积 净面积 线状地物
零星地类
( b) 实体的属性
控制 图斑 行政单位块面积
面积
( c) 联系的属性
图 4.5 用 E— R法表示实体或联系的属性
土
地
信
息
系
统
实体-联系方法
实体-联系方法 (Entity-relationship
approach)简称 E-R 方法,E -R 用来
描述现实世界中数据之间联系的有效
方法。 E -R 图在数据库设计中被广泛
应用,现已成为概念设计阶段描述数
据库概念模型的主要工具。
土
地
信
息
系
统
① E-R图的基本成分
E-R图中包含 实体, 联系 与 属性 三
种基本成份。
实体 即现实世界中存在的“人”或“物”。
例如图幅、土地、零星地类、图斑等都是实
体的例子。
联系 表示实体之间存在的关系。例如:图
斑面积通过扣除与线状地物相联系又可区分
为一对一(1:1)、一对多(1:M)、
多对多(M:N)等类型。
土
地
信
息
系
统
属性 表示实体或联系的某种特征。例如,
线状地物有图斑、线状序号、长、宽和面积。
值得注意的是,联系也可以有属性。例如,
图斑与线状地物的面积有, 数量, 属性。当
然,并不是所有的联系都必须有属性。
① E-R图的基本成份 (续 )
土
地
信
息
系
统
② 用 E-R 图描述概念模型
下面以土地面积量算信息系统为例,说明用
E-R方法来建立概念模型的具体步骤。
第一步:确定E-R模型应含的实体 。 如前
面所指出的,每一实体可用来代表一类数据
的集合。所以在本例中,可以暂定量算过的
3种表格为模型的第一批实体,并分别取名
为, 图幅,,, 图幅分划值计算表,,, 线
状地物, 。
土
地
信
息
系
统
这一步的目标是在实体之间建立所需的联系。
通常的作法是,根据对系统的功能分析首先
选出一至数项有代表性的单项应用,建立起
相应的局部E-R模型。然后在此基础上逐
渐扩充,所有实体之间均建立起应有的联系。
第二步:建立系统单项应用的局部E-R模型
土
地
信
息
系
统
② 用E-R图描述概念模型 (续 )
第三步,将 局部E-R模型 综合为 系统的
总体E-R模型 。
第四步:改进总体E-R模型 。通过综合得
到的初始模型常常存在不完善的地方,需要
进行改进。一个完善模型应该具有最小的数
据冗余。所以这一步的主要目的就是减少冗
余,尽可能避免数据的重复存贮。
土
地
信
息
系
统
土
地
信
息
系
统
图 4.6 TDMJ的总体结构
土
地
信
息
系
统
实现设计的任务,是确定数据库的逻辑结构。
前已多次提到,数据库可区分为 关系,层次,网
状 等数据模型。 VFP和大多数其它数据库只
支持关系数据模型,所以这里仅讨论怎样把
概念模型转变为数据库的关系模式。
4.3.2.3 实现设计
其目的是将前一步得出的 E- R模型转换为某一
特定数据库管理系统能够接受的逻辑模式。
土
地
信
息
系
统
4.3.2.3 实现设计 (续 )
E-R 模型向关系模式的转换
在关系型数据库中,每一数据库文件表示
为一个关系。从 E-R模型转换为关系模式,
就是将 E-R模型中的所有 实体和联系 都会 改
用关系来表示 。
土
地
信
息
系
统
从 E— R模型向关系模型转换的主要过程为:
A,确定各实体的 主关键字 ;
B,确定并写出实体 内部属性 之间的数据 关系表
达式 (函数依赖关系),即某一数据项决定另
外的数据项;
C,把经过 消冗处理 (规范化处理) 的数据关系
D,根据②、③形成新的关系。
E,完成转换后,迚行 分析、评价和优化 。
土
地
信
息
系
统
① 把每一实体转换为一个关系
首先分析实体的属性集,从中找出关系的
主键 (主键是关系数据库中可用于唯一地识
别仸何记录的字段 ),然后用关系式来表示
实体 。下面例中的实体,可分别转换为下列
关系。主键将决定其它属性的值,或者说其
它属性对主键存在依赖的关系。
E-R 模型向关系模式的转换 (续 )
土
地
信
息
系
统
例,实体转换为关系
实体名,控制面积计算表 对应的关
系,控制面积计算表 (综合号,单位号,块
号,单位名,一次值,二次值,平均值,面积,
平差面积 )
土
地
信
息
系
统
② 每一联系也转换成关系
E-R 模型向关系模式的转换 (续 )
联系的转换比较复杂。例如在 E-R模型中,
有的联系不带属性,有的联系可能带一个或
者多个属性。 在转换成关系时,在关系的属
性集中一般应包括,
( 1)联系本身的属性
( 2)由它所联系的各个实体的主键
土
地
信
息
系
统
例,联系名,控制所联系的实体及其主
键 ;
控制面积计算表 (主键为, 代码, )
碎面图斑计算表 (主键为, 图斑
号, )
对应的关系,图斑统计表 (代码,图斑
号,数量 )
土
地
信
息
系
统
因为控制单元内一般有多个图斑,只有代码
加上图斑号才能唯一地确定某一图斑在该控
制单元中的出现 。所以本例的主键应由两个
属性 ----代码与图斑号一起组成。这种由
几个属性一组合起来的主键,通常称为关系的
,复合键, 。
E-R 模型向关系模式的转换 (续 )
③ 转换结果的改进
土
地
信
息
系
统
4.3.2.4 物理设计 其目的在于确定数据
库的存储结构。
主要内容 包括确定记录存储格式,选择文
件存储结构,决定存取路径,分配存储空
间。
土
地
信
息
系
统
物理设计的好坏将对土地数据库的性能
影响很大, 一个好的物理存储结构必须
满足两个条件,
一是土地数据 占有较小的存储空间 ;
二是对数据库的操作具有 尽可能高的处
理速度 。
在完成物理设计后, 要进行 性能分析和
测试 。
土
地
信
息
系
统
第一步,确定 所有 字段的名称, 类型与宽度
设计 时请注意,
( 1) 去掉在不同关系中重复出现的属性;
( 2) 字段名既要便于识别, 又要尽量简化,
本例中采用拼音汉字的首字母作字段落名,
并删去了一些可省略的字符 。
4.3.2.4 物理设计(续)
第二步,确定 数据库 文件的名称及其组成
土
地
信
息
系
统
4.3.2.4 物理设计(续)
第三步,确定索引文件与索引码 。个别库不能建
立固定的索引,必要时可按应用的需要临时建立,
其余数据库文件应各建立一个索引文件与索引码。
第四步,按选定的语言 建立 上述的 数据库文件及
其索引文件 。
土
地
信
息
系
统
表 4.4 字段类型、名称与宽度
土
地
信
息
系
统
§ 4.4 数据库管理系统
数据管理系统( Data Base Manage
System) 是管理数据库的核心软件,它
建立在操作系统的基础上,数据库的所
有操作(数据库的建立、使用和维护)
都是在 DBMS的统一管理和控制下迚行的。
土
地
信
息
系
统
4.4.1 数据库管理系统的组成,
?语言
?数据库管理控制程序
?数据库服务程序
土
地
信
息
系
统
4.4.2 数据库管理系统的功能
① 数据库定义 是通过数据提供的 数据描
述语言 实现的。 描述语言 用来定义数据
库的 逻辑结构,数据库的结构框架、定
义数据级、建立记录类型、定义记录间
的联系、指定安全性控制要求、指定数
据完整性控制设备等。
土
地
信
息
系
统
② 数据库管理
③ 数据库通讯 是指数据库系统具备与操
作系统的接口处理,与各种语言的接口以
及与远程操作的接口处理等。
土
地
信
息
系
统
4.4.2 数据库管理系统的功能(续)
④ 数据库维护 是指系统应具备对数据
库重新定义、数据重新组织、性能监督
和分析以及对数据库整理和发生故障时
恢复运行能力。
土
地
信
息
系
统
包括以下几方面的内容,
A.改善系统的使用性能;
B.数据库受损后的复原;
C.用户应用管理;
D.拓宽数据库用户的需求。
土
地
信
息
系
统
§ 4.5 数据库系统的建立与维护
4.5.1 空间数据库的建立
① 建立空间数据库结构
利用 DBMS提供的 数据描述语言 描述
逻辑设计和物理设计的结果,得到 概念
模式和外模式,编写功能软件,经编译、
运行后形成目标模式,建立起实际的空
土
地
信
息
系
统
②
一般由编写的 数据装入程序 或 DBMS提供
的应用程序 来完成。在装入数据之前要做许
多 准备工作,如对数据进行整理、分类、编
码及格式转换。装入的数据要确保其准确性
③ 调试运行
装入数据后,要对地理数据库的实际应用
程序进行运行,执行各功能模块的操作,对地
理数据库系统的功能和性能进行 全面测试,
土
地
信
息
系
统
4.5.2 空间数据库的维护
①
指在 不改变 空间数据库 原来的逻辑结构
和 物理结构 的前提下,改变 数据的 存储位
置,将数据予以 重新组织和存放 。
土
地
信
息
系
统
② 空间数据库的重构造
指 局部改变 空间数据库的 逻辑结构 和 物
理结构 。数据库重构通过 改写 其概念模式
(逻辑模式 )的 内模式 (存储模式 )进行。
土
地
信
息
系
统
③ 空间数据库的完整性、安全性控制
完整性 是指数据的正确性、有效性
和一致性,主要由 后映象日志 来完成,
它是一个备份程序,当发生系统或介质
故障时,利用它对数据库进行恢复。
安全性 指对 数据的保护,主要通过
权限授予、审计跟踪,以及 数据的卸出
和装入 来实现。
4.5.2 空间数据库的维护 (续 )
土
地
信
息
系
统
1,解释字段、记录和数据库三个概念及其相互关
系?
2,常用的数据文件有哪几种,它们各有何特点?
3,数据库的主要特点是什么?
4,数据库的内模式与外模式有何区别?
5,数据库设计由哪些步骤构成,它们各有何特点?
6,数据库管理系统具有哪些功能?它们由哪几部
分组成?
7,土地信息数据库的特点是什么?它在土地系统
中有何作用?
思考题
土
地
信
息
系
统
参考文献
1.龚健雅,地理信息系统基础,北京,科学出版
社,2001:191-211,
2.陈述彭等,地理信息系统导论,北京,科学出版
社,1999:79-84,
3.黄杏元,地理信息系统概论,北京,高等教育出版
社,2001:108-134,
4.朱德海等,土地管理信息系统,中国农业大学出
版社,2000:69-74,
5.刘耀林等,土地信息系统,中国农业出版
社,2003:54-67,