藿乐威尔田园的真正迷人之处,在我看是:它的遁隐之深,离开村子有两英里,离开最近的邻居有半英里,并且有一大片地把它和公路隔开了;它傍着河流,据它的主人说,由于这条河,而升起了雾,春天就不会下霜了。
梭罗
在地球表面的任何地方都存在着垂直的和水平的两种关系:垂直关系把同一个地方的不同要素联结起来,而水平关系则把不同地方的各种因素联结起来。这两种关系的相对重要性随时代的变化而有所不同…正是这双重的关注,甚而至于这两种关系的结合,才为地理学提供了独特性和完整性。
R.J.约翰斯顿
第三章 空间数据模型
导读:本章描述的是整个GIS理论中最为核心的内容。为了能够利用信息系统工具来描述现实世界,并解决其中的问题,必须对现实世界进行建模。对于地理信息系统而言,其结果就是空间数据模型。空间数据模型可以分为三种:
场模型:用于描述空间中连续分布的现象;
要素模型:用于描述各种空间地物;
网络模型:可以模拟现实世界中的各种网络;
在各种模型中,又介绍了相关的概念,如空间划分,空间关系,以及拓扑关系的形式化描述——9交模型等。
最后讲述了普通的二维数据模型在空间上和时间上的扩展,时间数据模型和三维数据模型。
值得注意的是,本章谈到的场模型和要素模型类同于后面提及的栅格数据和矢量数据,但是前者是概念模型;后者是指其在信息系统中的实现。
1.空间数据模型的基本问题
人类生活和生产所在的现实世界是由事物或实体组成的,有着错综复杂的组成结构。从系统的角度来看,空间事物或实体的运动状态(在特定时空中的性状和态势)和运动方式(运动状态随时空变化而改变的式样和规律)不断发生变化,系统的诸多组成要素(实体)之间又存在着相互作用、相互制约的依存关系,表现为人口、物质、能量、信息、价值的流动和作用,反映出不同的空间现象和问题。为了控制和调节空间系统的物质流、能量流和人流等,使之转移到期望的状态和方式,实现动态平衡和持续发展,人们开始考虑对其中诸组成要素的空间状态、相互依存关系、变化过程、相互作用规律、反馈原理、调制机理等进行数字模拟和动态分析,这在客观上为地理信息系统提供了良好的应用环境和重要发展动力。
1.1概念
地理数据也可以称为空间数据(Spatial Data)。地理空间是指物质、能量、信息的存在形式在形态、结构过程、功能关系上的分布方式和格局及其在时间上的延续。地理信息系统中的地理空间分为绝对空间和相对空间两种形式。绝对空间是具有属性描述的空间位置的集合,它由一系列不同位置的空间坐标值组成;相对空间是具有空间属性特征的实体的集合,由不同实体之间的空间关系构成。在地理信息系统应用中,空间概念贯穿于整个工作对象、工作过程、工作结果等各个部分。空间数据就是以不同的方式和来源获得的数据,如地图、各种专题图、图像、统计数据等,这些数据都具有能够确定空间位置的特点。
空间数据模型是关于现实世界中空间实体及其相互间联系的概念,它为描述空间数据的组织和设计空间数据库模式提供着基本方法。因此,对空间数据模型的认识和研究在设计GIS空间数据库和发展新一代GIS系统的过程中起着举足轻重的作用(图3-1)。
图3-1:概念数据模型
1.2空间数据模型的类型
在GIS中与空间信息有关的信息模型有三个,即基于对象(要素)(Feature)的模型、网络(Network)模型以及场(Field)模型。基于对象(要素)的模型强调了离散对象,根据它们的边界线以及组成它们或者与它们相关的其它对象,可以详细地描述离散对象。网络模型表示了特殊对象之间的交互,如水或者交通流。场模型表示了在二维或者三维空间中被看作是连续变化的数据。
有很多类型的数据,有时被看作场,有时被看作对象。选择某一种模型而不选择另外一种模型主要是顾及数据的测量方式。如果数据来源于卫星影像,其中某一现象的一个值主要是为区域内每一个位置提供的,如作物类型或者森林类型可以采用一个基于场的观点;如果数据是以测量区域边界线的方式而且区域内部被看成是一致的,就可以采用一个基于要素的观点;如果是将分类空间分成粗略的子类,一个基于场的模型可以被转换成一个基于要素的模型,因为后者更适合于离散面的或者线的特征的度量和分析。
1.3 GIS空间数据模型的学术前沿
时空数据模型、三维数据模型、动态空间数据结构、分布式空间数据管理、空间存取方法、GIS设计的CASE工具等是目前国际上GIS空间数据模型研究的学术前沿。
1.3.1时空数据模型
时空数据模型的核心问题是研究如何有效地表达、记录和管理现实世界的实体及其相互关系随时间不断发生的变化。这种时空变化表现为三种可能的形式,一是属性变化,其空间坐标或位置不变;二是空间坐标或位置变化,而属性不变,这里空间的坐标或位置变化既可以是单一实体的位置、方向、尺寸、形状等发生变化,也可以是两个或两个以上的空间实体之间的关系发生变化;三是空间实体或现象的坐标和属性都发生变化。当前时态GIS研究的主要问题有:表达时空变化的数据模型、时空数据组织与存取方法、时空数据库的版本问题、时空数据库的质量控制、时空数据的可视化问题等。
1.3.2三维空间数据模型
国际上关于三维空间数据模型的研究大体上可分为两个方向:一是三维矢量模型,其是用一些基元及其组合去表示三维空间目标,这些基元本身是可以用简单数学解析函数描述的。二是体模型,以体元(Voxel)模型为代表,这种体元模型的特点是易于表达三维空间属性的非均衡变化,其缺点是所占存储空间大、处理时间长。
1.3.3分布式空间数据模型
分布式空间数据库管理系统和联邦空间数据库是国际上关于分布式空间数据模型的两个主要研究方向。
1)分布式空间数据库管理系统
分布式空间数据库管理系统是将空间数据库技术与计算机网络技术相结合,利用计算机网络对通过通讯线路相关联的空间数据库进行数据和程序的分布处理,以实现集中与分布的统一,即分布式空间数据库管理系统是将分散的空间数据库连成一体。其主要问题包括空间数据的分割、分布式查询、分布式并发控制。
2)联邦空间数据库(Federated Spatial Database)
联邦空间数据库则是在不改变不同来源的各空间数据库管理系统的前提下,将非均质的空间数据库系统联成一体,形成联邦式的空间数据库管理体系,并向用户提供统一的视图。
1.3.4 CASE工具*
CASE工具是计算机信息系统结构化分析、数据流程描述、数据实体关系表达、数据字典与系统原型生成、原代码生成的重要工具,在非空间型计算机信息系统的设计与建立中有着较为广泛的应用。当前国际上的一个重要发展方向是,根据GIS空间数据建模的特点和CASE工具的原理,在现有CASE软件平台上,发展GIS空间数据建模与系统设计的专用功能,这将有效地提高GIS空间数据建模及其应用系统设计的自动化程度和技术水平。
2.场模型
对于模拟具有一定空间内连续分布特点的现象来说,基于场的观点是合适的。例如,空气中污染物的集中程度、地表的温度、土壤的湿度水平以及空气与水的流动速度和方向。根据应用的不同,场可以表现为二维或三维。一个二维场就是在二维空间中任何已知的地点上,都有一个表现这一现象的值;而一个三维场就是在三维空间中对于任何位置来说都有一个值。一些现象,诸如空气污染物在空间中本质上讲是三维的,但是许多情况下可以由一个二维场来表示。
场模型可以表示为如下的数学公式:
z : s( z ( s )
上式中,z为可度量的函数,s表示空间中的位置,因此该式表示了从空间域(甚至包括时间坐标)到某个值域的映射。表3-1给出了地理研究中一些常模型的例子[A. Vckovski]。
场模型
定义域维数
值域维数
自变量
因变量
T(z)
1
1
空间坐标(高程)
高度z处的气温
E(t)
1
3
时间坐标
某时刻的静电力
H(x,y)
2
1
空间坐标
地表高程
P(x,y,z)
3
1
空间坐标
土壤的孔隙度
v(λ,φ,z)
3
3
空间坐标(λ,φ经纬度,z高度)
风速(三维矢量)
σ(x,y,z)
3
9
空间坐标
压力张量
Θ(λ,φ,p,t)
4
1
p压力面,t时间
潜温
Θt(λ,φ,p)
3
∞
p压力面
时间序列的潜温
I(x,y,z,t,λ)
5
1
x,y,z,t时空坐标,λ波长
波长λ的电磁波在x,y,z,t处的辐射强度
2.1场的特征
场经常被视为由一系列等值线组成,一个等值线就是地面上所有具有相同属性值的点的有序集合。
2.1.1空间结构特征和属性域
在实际应用中,“空间”经常是指可以进行长度和角度测量的欧几里德空间。空间结构可以是规则的或不规则的,但空间结构的分辨率和位置误差则十分重要,它们应当与空间结构设计所支持的数据类型和分析相适应。属性域的数值可以包含以下几种类型:名称、序数、间隔和比率。属性域的另一个特征是支持空值,如果值未知或不确定则赋予空值。
2.1.2连续的、可微的、离散的
如果空间域函数连续的话,空间域也就是连续的,即随着空间位置的微小变化,其属性值也将发生微小变化,不会出现像数字高程模型中的悬崖那样的突变值。只有在空间结构和属性域中恰当地定义了“微小变化”,“连续”的意义才确切;
当空间结构是二维(或更多维)时,坡度——或者称为变化率——不仅取决于特殊的位置,而且取决于位置所在区域的方向分布(图3-2)。连续与可微分两个概念之间有逻辑关系,每个可微函数一定是连续的,但连续函数不一定可微。
图3-2:某点的坡度取决于位置所在区域的各方向上的可微性
如果空间域函数是可微分的,空间域就是可微分的;行政区划的边界变化是离散的一个例子,如果目前测得的边界位于A,而去年这时边界位于B,但这并不表明6个月前边界将位于BA之间的中心,边界具有不连续跃变。
2.1.3与方向无关的和与方向有关的(各向同性和各向异性)
空间场内部的各种性质是否随方向的变化而发生变化,是空间场的一个重要特征。如果一个场中的所有性质都与方向无关,则称之为各向同性场(Isotropic Field)。例如旅行时间,假如从某一个点旅行到另一个点所耗时间只与这两点之间的欧氏几何距离成正比,则从一个固定点出发,旅行一定时间所能到达的点必然是一个等时圆,如图3-3-(a)所示。如果某一点处有一条高速通道,则利用与不利用高速通道所产生的旅行时间是不同的,见图3-3-(b)。等时线已标明在图中,图中的双曲线是利用与不利用高速通道的分界线。本例中的旅行时间与目标点与起点的方位有关,这个场称为各向异性场(Anisotropic Field)。
(a) (b)
图3-3:在各向同性与各向异性场中的旅行时间面
2.1.4空间自相关
空间自相关是空间场中的数值聚集程度的一种量度。距离近的事物之间的联系性强于距离远的事物之间的联系性。如果一个空间场中的类似的数值有聚集的倾向,则该空间场就表现出很强的正空间自相关;如果类似的属性值在空间上有相互排斥的倾向,则表现为负空间自相关(图3-4)。因此空间自相关描述了某一位置上的属性值与相邻位置上的属性值之间的关系。
图3-4:强空间正负自相关模式
2.2栅格数据模型
栅格数据模型是基于连续铺盖的,它是将连续空间离散化,即用二维铺盖或划分覆盖整个连续空间;铺盖可以分为规则的和不规则*的,后者可当做拓扑多边形处理,如社会经济分区、城市街区;铺盖的特征参数有尺寸、形状、方位和间距。对同一现象,也可能有若干不同尺度、不同聚分性(Aggregation or Subdivisions)的铺盖。在边数从3到N的规则铺盖(Regular Tesselations)中,方格、三角形和六角形是空间数据处理中最常用的。三角形是最基本的不可再分的单元,根据角度和边长的不同,可以取不同的形状,方格、三角形和六角形可完整地铺满一个平面(图3-5)。
图3-5:三角形、方格和六角形划分
基于栅格的空间模型把空间看作像元(Pixel)的划分(Tessellation),每个像元都与分类或者标识所包含的现象的一个记录有关。像元与“栅格”两者都是来自图像处理的内容,其中单个的图像可以通过扫描每个栅格产生。GIS中栅格数据经常是来自人工和卫星遥感扫描设备中,以及用于数字化文件的设备中。采用栅格模型的信息系统,通常应用了前面所述的分层的方法。在每个图层中栅格像元记录了特殊的现象的存在。每个像元的值表明了在已知类中现象的分类情况(图3-6)。
图3-6:栅格数据模型
由于像元具有固定的尺寸和位置,所以栅格趋向于表现在一个“栅格块”中的自然及人工现象。因此分类之间的界限被迫采用沿着栅格像元的边界线。一个栅格图层中每个像元通常被分为一个单一的类型。这可能造成对现象的分布的误解,其程度则取决与所研究的相关的像元的大小。如果像元针对特征而言是非常小的,栅格可以是一个来表现自然现象的边界随机分布的特别有效的方式,该现象趋于逐渐地彼此结合,而不是简单地划分。如果每个像元限定为一个类,栅格模型就不能充分地表现一些自然现象的转换属性。除非抽样被降低到一个微观的水平,否则许多数据类事实上都是混合类。模糊的特征通过混合像元,在一个栅格内可以被有效地表达,其中组成分类通过像元所有组成度量的或者预测的百分比来表示。尽管如此,也应该强调一个栅格的像元仅仅被赋予一个单一的值。
为了GIS数据处理,栅格模型的一个重要的特征就是每个栅格中的像元的位置被预先确定,所以很容易进行重叠运算以比较不同图层中所存储的特征。由于像元位置是预先确定的,且是相同的,在一个具体的应用的不同的图层中,每个属性可以从逻辑上或者从算法上与其它图层中的像元的属性相结合以便产生相应的重叠中一个的属性值。其不同于基于图层的矢量模型之处,在于图层中的面单元彼此是独立的,直接地比较图层必须作进一步处理以识别重叠的属性。
体元(Voxels):GIS中基于的栅格表示可以被扩展到三维以产生一个体元(Voxel)模型,其中像元是由长方形,典型是立方体、立体元素所组成。地理数据的一些类型,并不总是由边界表示的,因为数据值可能与一个属性相关,而该属性随着位置的变化而变化,而且并不是清楚地理解边界。这类模型的数据的一个比较合适的模型就是体元模型。该模型被广泛地应用于媒体成像,其中它们源于计算机辅助断层(CT)及核磁反应扫描仪。它们很好地表现渐进的、特殊的位置变化,并适于产生这种变化的剖面图。
3.要素模型
3.1欧氏(Euclidean)空间和欧氏空间中的三类地物要素
许多地理现象模型建立的基础就是嵌入(Embed)在一个坐标空间中,在这种坐标空间中,根据常用的公式就可以测量点之间的距离及方向,这个带坐标的空间模型叫做欧氏空间,它把空间特性转换成实数的元组(Tuples)特性,两维的模型叫做欧氏平面。欧氏空间中,最经常使用的参照系统是笛卡尔坐标系(Cartesian Coordinates),它是由一个固定的、特殊的点为原点,一对相互垂直且经过原点的线为坐标轴。此外,在某些情况下,也经常采用其它坐标系统,如极坐标系(Polar Coordinates)。
将地理要素嵌入到欧氏空间中,形成了三类地物要素对象,即点对象、线对象和多边形对象。
3.1.1点对象
点是有特定的位置,维数为零的物体,包括:
.点实体(Point Entity):用来代表一个实体;
.注记点:用于定位注记;
.内点(Label Point):用于记录多边形的属性,存在于多边形内;
.结点(节点)(Node):表示线的终点和起点;
.角点(Vertex):表示线段和弧段的内部点。
3.1.2线对象
线对象是GIS中非常常用的维度为1的空间组分,表示对象和它们边界的空间属性,由一系列坐标表示,并有如下特征:
.实体长度:从起点到终点的总长;
.弯曲度:用于表示像道路拐弯时弯曲的程度;
.方向性:水流方向是从上游到下游,公路则有单向与双向之分。
线状实体包括线段、边界、链、弧段、网络等,多边线如图3-7所示。
3.1.3多边形对象
面状实体也称为多边形,是对湖泊、岛屿、地块等一类现象的描述。通常在数据库中由一封闭曲线加内点来表示。面状实体有如下空间特性:
.面积范围;
.周长;
.独立性或与其它的地物相邻,如中国及其周边国家;
.内岛或锯齿状外形,如岛屿的海岸线封闭所围成的区域等;
.重叠性与非重叠性,如报纸的销售领域,学校的分区,菜市场的服务范围等都有可能出现交叉重叠现象,一个城市的各个城区一般说来相邻但不会出现重叠。
在计算几何中,定义了许多不同类型的多边形,如图3-7所示。
图3-7:多边线和多边形
3.2要素模型的基本概念
基于要素的空间模型强调了个体现象,该现象以独立的方式或者以与其它现象之间的关系的方式来研究。任何现象,无论大小,都可以被确定为一个对象(Object),假设它可以从概念上与其邻域现象相分离。要素可以由不同的对象所组成,而且它们可以与其它的相分离的对象有特殊的关系。在一个与土地和财产的拥有者记录有关的应用中,采用的是基于要素的视点,因为每一个土地块和每一个建筑物必须是不同的,而且必须是唯一标识的并且可以单个地测量。一个基于要素的观点是适合于已经组织好的边界现象的,尽管并不被限定。因此,这也适合于人为现象的,例如,建筑物、道路、设施和管理区域。一些自然现象,如湖、河、岛及森林,经常被表现在基于要素的模型中的,因为它们为了某些目的,可以被看成为离散的现象,但应该记住的是,这样现象的边界随着时间的变化很少是固定的,因此,在任何时刻,它们的实际的位置定义很少是精确的。
基于要素的空间信息模型把信息空间分解为对象(Object)或实体(Entity)。一个实体必须符合三个条件:
.可被识别;
.重要(与问题相关);
.可被描述(有特征)。
而有关实体的特征,可以通过静态属性(如城市名)、动态的行为特征和结构特征来描述实体。与基于场的模型不同,基于要素的模型把信息空间看作许多对象(城市、集镇、村庄、区)的集合,而这些对象又具有自己的属性(如人口密度、质心和边界等)。基于要素的模型中的实体可采用多种维度来定义属性,包括:空间维、时间维、图形维和文本/数字维。
空间对象之所以称为“空间的”,是因为它们存在于“空间”之中,即所谓“嵌入式空间”。空间对象的定义取决于嵌入式空间的结构。常用的嵌入式空间类型有:(1)欧氏空间,它允许在对象之间采用距离和方位的量度,欧氏空间中的对象可以用坐标组的集合来表示;(2)量度空间,它允许在对象之间采用距离量度(但不一定有方向);(3)拓扑空间,它允许在对象之间进行拓扑关系的描述(不一定有距离和方向);(4)面向集合的空间,它只采用一般的基于集合的关系,如包含、合并及相交等。
1)欧氏平面上的空间对象类型
图3-8表示了在连续的二维欧氏平面上的一种可能的对象继承等级图。
图3-8:连续空间对象类型的继承等级
在上图中,具有最高抽象层次的对象是“空间对象”类,它派生为零维的点对象和延伸对象,延伸对象又可以派生维一维和二维的对象类。一维对象的两个子类:弧和环(Loop),如果没有相交,则称为简单弧(Simple Arc)和简单环(Simple Loop)。在二维空间对象类中,连通的面对象称为面域对象,没有“洞”的简单面域对象称为域单位对象。
2)离散欧氏平面上的空间对象
欧氏空间的平面因连续而不可计算,必须离散化后才适合于计算。图3-8中所有的连续类型的离散形式都存在。图3-9表示了部分离散一维对象继承等级关系*。
图3-9:离散一维对象的继承等级
对象行为是由一些操作定义的。这些操作用于一个或多个对象(运算对象),并产生一个新的对象(结果)。可将作用于空间对象的空间操作分为两类:静态的和动态的。静态操作不会导致运算对象发生本质的改变,而动态操作会改变(甚至生成或删除)一个或多个运算对象。
虽然系统的面向对象方法和基于要素的空间数据模型在概念上很相似,但两者之间仍然有着明显的差别。实现基于要素的模型并不一定要求运用面向对象的方法;另一方面,面向对象方法既可以作为描述场的空间模型的框架,也可以作为描述基于要素的空间模型的框架。对于基于要素的模型,采用面向对象的描述是显然合适的;而对于基于场的模型同样可以用面向对象方法来构建。
场和对象可以在多种水平上共存,对于空间数据建模来说,基于场的方法和基于要素的方法并不互相排斥。有些应用可以很自然地应用场来建模,如前面例子中提到的某一区域的气候属性变化就适合于建立场模型;但是,即使是在这种情况下,场模型也并不是适合所有情况。例如,如果采集降雨数据的各个点在空间上很分散且分布无规律,加之这些采集点还有各自的特征,那么,一个包含两个属性,即位置和平均降雨量的对象也许更适合于区域气候属性变化的描述。总之,基于场的模型和基于要素的模型各有长处,应该恰当地综合运用这两种方法来建模。在地理信息系统应用模型的高层建模中、数据结构设计中及地理信息系统应用中,都会遇到这两种模型的集成问题。图3-10描述了要素模型和场模型的比较。
图3-10:要素模型和场模型的比较[A. Vckovski]
3.3矢量数据模型
矢量方法(图3-11)强调了离散现象的存在,由边界线(点、线、面)来确定边界,因此可以看成是基于要素的。然而,在一些基于矢量的GIS中,表现表面的便利,带给它模拟二维场的可能性,最常见的例子就是地表高程。栅格技术将重点放置在了空间格网像元位置的内容上,因此经常被描述为基于位置的。栅格数据模型似乎与上面所描述的场的观点相似,但是所储存的空间信息模型并不是对一个连续变量的描述,而它是格网——像元值的一个集合,这些值当然可以被看成抽样一个场模型,但是同样可以被抽样成一个基于对象的模型。
图3-11:矢量数据模型
矢量数据模型将现象看作原形实体的集合,且组成空间实体。在二维模型内,原型实体是点、线和面;而在三维中,原型也包括表面和体。观察的尺度或者概括的程度,决定了使用的原型的种类。在一个小比例尺表现中,诸如城镇这一现象可以由个别的点所组成,而路和河流由线来表示。当表现的比例尺增大时,必然要考虑到现象的尺度;在一个中等比例尺上,一个城镇可以由特定的原型,如线,来表示用以记录其边界。在较大的比例尺中,城镇将被表现为特定的原型的复杂的集合,包括建筑物的边界、道路、公园以及所包含的其它的自然与管理现象。
矢量模型的表达源于原型空间实体本身,通常以坐标来定义。一个点的位置可以二维或者三维中的坐标的单一集合来描述。一条线通常由有序的两个或者多个坐标对集合来表示。特定坐标之间线的路径可以是一个线性函数或者一个较高次的数学函数,而线本身可以由中间点的集合来确定。一个面通常由一个边界来定义,而边界是由形成一个封闭的环状的一条或多条线所组成。如果区域有个洞在其中,那么可以采用多个环以描述它。
依据应用的类型,对采用矢量数据描述三维模型有一些特殊的要求。地形模型应用要求或者是简单的、单一值的表面(单一值的表面是指对于任意的位置,都有单一的、确定的高程数值),这仅可以表示地表高程;或者它们与地形表面的地形特征相结合,在景观结构中,有必要将地形表面与特征的三维表现结合起来,例如位于其上的建筑物与植被*。为了制图目的,表现地形表面的传统方法可以采用等高线,而对于分析目的而言,等高线并不是一个方便的表示;如果表面被采样为等值线(也许从一个地图上被数字化),它们通常将被转换成最通用的基于GIS的地形表现,如规则格网及不规则三角网。点值的规则格网、或者矩阵,可以直接地来自一个原始的规则的抽样的方案中,通常情况下,是对不规则分布数值的内插,不规则分布数值可以包括数字化等高线和离散点的高程数值。TIN的特征是它们保留了原始的不规则抽样的数据值,它是一个三角化的被用来表现一个三角形的平面,并与这些原始数值相联系。一个TIN单元的表面在缺省情况下被看成平面(Plannar),但是顶点之间也可以采用曲面函数来进行插值。
如果TIN被用来表现一个单一值的表面(无论是地形数据还是其它),在与一个插值函数相结合的情况下,它提供了一个二维场的数字化的表现。同样地,如果一个采样点格网同
时伴随着一个采样点之间插值函数,它也可以用于实现一个场模型。
如果体对象被存储于基于矢量的GIS中,它们通常由闭合的一个或者多个表面来定义;而表面可以由三维线包围的多边形面所定义。线及其构成的点,或顶点的集合,定义了这样的表面为一个多边形网状结构。网的每个表面被视为平面的或者是曲面的;在这两种情况下,需要一个数学的函数用来指示具体坐标之间表面的位置。如果需要一个光滑的表面,可以通过多边形网的顶点来构造数字表面函数,那么,这样一个表面的计算机图形展示就可以通过将数字的表面分解成非常小的平面来实现。数学表面函数的例子如B样条函数。这些类型的函数控制了已知的控制点与拟合表面之间的关系,包括了表面的度量以及它与控制点之间的近似程度。
4.基于要素的空间关系分析
4.1空间关系的基本概念
在地理信息系统中集中存储了以下的内容:
.空间分布位置信息
.属性信息
.拓扑空间关系信息。
由此可见,空间位置、关系与度量的描述在GIS中起着举足轻重的作用。
地理要素之间的空间区位关系可抽象为点、线(或弧)、多边形(区域)之间的空间几何关系,其关系如下,如图3-12示。
图3-12:地理要素之间的部分拓扑空间关系
1)点——点关系
相合;
分离;
一点为其它诸点的几何中心;
一点为其它诸点的地理重心。
2)点——线关系
点在线上:可以计算点的性质,如拐点等;
线的端点:起点和终点;
线的交点;
点与线分离:可计算点到线的距离。
3)点——面关系
点在区域内,可以记数和统计;
点为区域的几何中心;
点为区域的地理重心;
点在区域的边界上;
点在区域外部。
4)线——线关系
重合;
相接:首尾环接或顺序相接;
相交:
相切;
并行。
5)线——面关系
区域包含线:可计算区域内线的密度;
线穿过区域:
线环绕区域:对于区域边界,可以搜索其左右区域名称;
线与区域分离。
6)面——面关系
包含:如岛的情形;
相合:
相交:可以划分子区,并计算逻辑与、或、非和异或;
相邻:计算相邻边界的性质和长度;
分离:计算距离、引力等。
近年来,空间关系的理论与应用研究在国内外都非常多。究其原因,一方面是它为地理信息系统数据库的有效建立、空间查询、空间分析、辅助决策等提供了最基本的关系;另一方面是将空间关系理论应用于地理信息系统查询语言,形成一个标准的SQL空间查询语言,可以通过API(Application Program Interface,应用程序接口)进行空间特征的存储、提取、查询、更新等。
空间关系包含三种基本类型,即拓扑关系、方向关系、度量关系。
4.2拓扑空间关系分析
4.2.1拓扑属性
拓扑一词来自于希腊文,意思是“形状的研究”。拓扑学是几何学的一个分支,它研究在拓扑变换下能够保持不变的几何属性——拓扑属性。为了得到一些拓扑的感性认识,假设欧氏平面是一张高质量无边界的橡皮,该橡皮能够伸长和缩短到任何理想的程度。想象一下基于这张橡皮所绘制的图形,允许这张纸伸长但是不能撕破或者重叠,这样原来图形的一些属性将保留,而有些属性将会失去。例如,在橡皮表面有一个多边形,多边形内部有一个点。无论对橡皮进行压缩或拉伸,点依然存在于多边形内部,点和多边形之间的空间位置关系不改变,而多边形的面积则会发生变化。前者则是空间的拓扑属性,后者则不是拓扑属性。表3-2列出了包含在欧氏平面中的对象的拓扑和非拓扑属性。
表3-2:欧氏平面上实体对象所具有的拓扑和非拓扑属性
拓扑属性
一个点在一个弧段的端点
一个弧段是一个简单弧段(弧段自身不相交)
一个点在一个区域的边界上
一个点在一个区域的内部
一个点在一个区域的外部
一个点在一个环的内部
一个面是一个简单面(面上没有“岛”)
一个面的连续性(给定面上任意两点,从一点可以完全在面的内部沿任意路径走向另一点)
非拓扑属性
两点之间的距离
一个点指向另一个点的方向
弧段的长度
一个区域的周长
一个区域的面积
从表中可以看出,拓扑属性描述了两个对象之间的关系,因此又称为拓扑关系(Topological Relation)。图3-13为拓扑空间关系的形式化表达。
图3-13:拓扑空间中的点和邻域
4.2.2拓扑描述的数学基础——点集拓扑学
拓扑学是几何学分支之一,作为近代数学的一门基础理论学科,拓扑学已经渗透到数学的许多分支以及物理、化学和生物学之中,而且在工程技术中也获得了广泛的应用。由于拓扑学是研究图形在拓扑变化下不变的性质,拓扑学已成为地理信息系统空间关系的理论基础,为空间点、线、面之间的包含、覆盖、相离和相接等空间关系的描述提供直接的理论依据。
定义1:X为一非空集合,ρ:X×X→R为一映射,如果对于任意的x,y,z∈X,有:
(1)ρ(x,y)≥0,并且ρ(x,y)=0当且仅当x=y;
(2)ρ(x,y)=ρ(y,x);
(3)ρ(x,z)≤ρ(x,y)+ρ(y,z) (三角不等式);
则称ρ为X的度量,偶对(X,ρ)称为度量空间。
定义2:A为度量空间X的子集,如果A的每一点都有一个球形邻域包含于A,则称A为ρ的开集。
定义3:X为非空集合,A为X的子集族,如果满足下列条件:
(1) X和空集Φ属于A;
(2)若A1,A2属于A,则A1与A2的交集属于A;
(3)A中任意两个元素的并仍为A中的元素;
则称A为X的拓扑。如果A为集合X的拓扑,则称偶对(X,A)为拓扑空间。
定义4:A为拓扑空间X的子集。如果点x属于X的每一邻域U中都有A中异于x的点,即U∩(A~{x})≠Φ,则称x为A的聚点或极限点。A的聚点可以属于A也可以不属于A。
定义5:A为拓扑空间X的子集,集合A的所有聚点构成的集合称为A的导集,记作dX(A)或d(A)。
定义6:A为拓扑空间X的子集,如果A的每一聚点都属于A,即d(A)为A的子集,则称A为闭集。
定义7:X为拓扑空间,X的子集A与A的导集d(A)的并集A∪d(A)称为A的闭包,记作C(A)。
定义8:为拓扑空间X的子集,如果A是点x属于X的邻域,即存在X的开集U使得x属于U,U为A的子集,则称点x为集合A的内点。集合A的所有内点构成的集合,称为A的内部,记作I(A)。
定义9:A为拓扑空间X的子集,对于点x属于X,如果在x的任一邻域U中既有A的点又有~A的点,即:U∩A≠Φ并且U∩(~A)≠Φ,则称x为集合A的边界点。集合A的所有边界点的集合称为集合A的边界,记作B(A)。
定理1:A为拓扑空间X的任意子集,则:
C(A)=~I(~A)=I(A)∪B(A)
I(A)=~C(~A)=C(A)~B(A)
B(A)=C(A)∩C(~A)=~(I(A)∪I(~A))=B(~A)
4.2.3拓扑空间关系描述——9交模型
设有现实世界中的两个简单实体A、B,B(A)、B(B)表示A、B的边界,I(A)、I(B)表示A、B的内部,E(A)、E(B)表示A、B余。Egenhofer[1993]构造出一个由边界、内部、余的点集组成的9-交空间关系模型(9-Intersection Model,9-IM)如下*:
B(A)∩B(B)
B(A)∩I(B)
B(A)∩E(B)
I(A)∩B(B)
I(A)∩I(B)
I(A)∩E(B)
E(A)∩B(B)
E(A)∩I(B)
E(A)∩E(B)
对于该矩阵中的每一元素,都有“空”与“非空”两种取值,9个元素总共可产生29=512种情形。
9交模型形式化地描述了离散空间对象的拓扑关系,基于9交模型,可以定义空间数据库的一致性原则,并应用于数据库更新、维护中。此外,9交模型也是进一步研究空间关系的基础*。
9交模型一共可以表达512种可能的空间关系,但是在实际上,有些关系并不存在。表2给出了面/面(A/A),面/线(A/L),面/点(A/P),线/线(L/L),线/点(L/P),点/点(P/P)可能空间关系的矩阵形式。其中“-”表示不可能存在该关系,“Yb”表示在单值和多值的矢量图上都可能存在的关系,“Ym”在多值的矢量图上可能存在的关系*。
表3-3:通过9-交模型表示的两个要素可能的拓扑关系(表中将矩阵的9个数值展开得到一个二进制数值,1表示相应交集不为空,0表示交集为空)
关系
9-交模型矩阵
A/A
A/L
A/P
L/L
L/P
P/P
r026
000011010
-
-
-
-
-
Yb
r030
000011110
-
-
Yb
-
Yb
-
r031
000011111
Yb
Yb
-
Yb
-
-
r063
000111111
-
Yb
-
Yb
-
-
r092
001011100
-
-
Yb
-
Yb
-
r093
001011101
-
-
-
Yb
-
-
r095
001011111
-
-
-
Yb
-
-
r127
001111111
-
-
-
Yb
-
-
r159
010011111
-
-
-
Yb
-
-
r179
010110011
Ym
-
-
Ym
-
-
r191
010111111
-
Yb
-
Yb
-
-
r220
011011100
Ym
Yb
-
Ym
-
-
r223
011011111
-
-
-
Yb
-
-
r252
011111100
-
Yb
-
-
-
-
r253
011111101
-
Yb
-
-
-
-
r255
011111111
-
Yb
-
Ym
-
-
r272
100010000
-
-
-
-
-
Ym
r277
100010101
-
-
-
Yb
-
-
r279
100010111
Yb
-
-
-
-
-
r284
100011100
-
-
Yb
-
Yb
-
r285
100011101
Yb
Yb
-
-
-
-
r287
100011111
Yb
Yb
-
Yb
-
-
r311
100110111
-
-
-
Yb
-
-
r316
100111100
-
Yb
-
-
-
-
r317
100111101
-
Yb
-
-
-
-
r319
100111111
-
Yb
-
-
-
-
r349
101011101
-
-
-
Yb
-
-
r373
101110101
-
-
-
Yb
-
-
r400
110010000
Ym
-
-
Ym
-
-
r412
110011100
-
Yb
-
-
-
-
r415
110011111
-
-
-
Yb
-
-
r435
110110011
Ym
-
-
Ym
-
-
r439
110110111
-
-
-
Yb
-
-
r444
110111100
-
Yb
-
-
-
-
r445
110111101
-
Yb
-
-
-
-
r447
110111111
-
Yb
-
-
-
-
r476
111011100
Ym
Yb
-
Ym
-
-
r477
111011101
-
-
Yb
-
-
r501
111110101
-
-
Yb
-
-
r508
111111100
-
Yb
-
-
-
-
r509
111111101
-
Yb
-
-
-
-
r511
111111111
Yb
-
-
-
-
-
从上表可以看出,可能的拓扑关系数目要远远少于512个(面/面:6,面/线:19,面/点:3,线/线:16,线/点:3,点/点:2)。图3-14给出了这些可能关系的图示。从某种意义上讲,9-交模型所描述的拓扑关系只是拓扑关系的类别,对于每一类别可以有多种可能的情形,例如两条相交的线,一个交点的情形和多个交点的9-交模型表示是一致的,但是其拓扑关系并不同。
图3-14:9-交模型所述拓扑关系图示
9交模型的扩展
通过引进点集的余,9-交空间关系模型增强了面/线、线/线空间关系的唯一性。但它仅仅用“空”与“非空”来区分两个目标的边界、内部、余,对面/面、点/点、点/线、点/面的空间关系描述并无多大改进。为此,该方法仍有一定的局限性。
在地理信息系统中,数据可以划分为几何数据与属性数据两大类型。由于几何数据具有可量测性,为此地理信息系统所涉及的客观世界是一个度量空间,而且每个度量空间又是一个拓扑空间。根据目标的自由度,基本实体可划分为点、线、面三种基本类型。点状目标具有固定的位置和方向,将其定义为零维目标;线状目标都有一条有形或无形的定位线,将其定义为一维目标;面状目标都有一个有形或无形的轮廓线,将其定义为二维目标。
运用维数扩展法,将9-IM进行扩展,利用点、线、面的边界、内部、余之间的交集的维数来作为空间关系描述的框架。对于几何实体的边界,它是比其更低一维的几何实体的集合。为此,点的边界为空集;线的边界为线的两个端点,当线为闭曲线时,线的边界为空;面的边界由构成面的所有线构成。若设P为一个点集,定义点集的求维函数DIM如下:
利用维数扩展法,9交模型可扩展为
DIM(B(A)∩B(B))
DIM(B(A)∩I(B))
DIM(B(A)∩E(B))
DIM(I(A)∩B(B))
DIM(I(A)∩I(B))
DIM(I(A)∩E(B))
DIM(E(A)∩B(B))
DIM(E(A)∩I(B))
DIM(E(A)∩E(B))
2)根据DE-9IM,对于点集拓扑空间X,当需要进行关系判别时,可对矩阵的9元取值进行分析、比较。令C为各单元交的点集,其取值P可能为{T,F,*,0,1,2}。各个取值的具体含义为:
1)P=T DIM(C)∈{0,1,2},即交集C包含有点、线、面;
2)P=F DIM(C)=-1,即交集C为空;
3)P=* DIM(C)∈{-1,0,1,2},即两目标交集既有点、线、面,又含有某些部分的交为空的情形,该情况在关系判别时,一般不予以考虑;
4) P=0 DIM(C)=0;
5) P=1 DIM(C)=1;
6) P=2 DIM(C)=2。
扩展9-交模型中各元素通过取值{T,F,*,0,1,2},可产生的情形为69=10077696种,关系非常复杂,通过对大量的空间关系进行归纳和分类,得出5种基本的空间关系:相离关系(Disjoint)、相接关系(Touch)、相交关系(Cross)、包含于关系(In)、交叠关系(Overlap),并将这5种关系定义为空间关系的最小集,其特征为:
1) 相互之间不能进行转化;
2) 能覆盖所有的空间关系模式;
3) 能应用于同维与不同维的几何目标;
4) 每一种关系对应于唯一的DE-9IM矩阵;
5) 任何其它的DE-9IM关系可以通过用这5种基本关系进行表达。
4.2.4拓扑空间关系识别
在地理信息系统中,空间数据具有属性特征、空间特征和时间特征,基本数据类型包括属性数据、几何数据和空间关系数据。作为基本数据类型的空间关系数据主要指点/点、点/线、点/面、线/线、线/面、面/面之间的相互关系。
4.3方向空间关系分析
4.3.1方向关系描述
方向关系又称为方位关系、延伸关系,它定义了地物对象之间的方位,如“河北省在河南省北部”就描述了方向关系。为了定义空间目标之间的方向关系,首先定义点目标之间的关系。给定定位参考,即相互垂直的X、Y坐标轴,方向关系的定义采用垂直于坐标轴的直线为参考。令Pi为目标P的点(P为原目标),Qj为目标Q的点(Q为参考目标),X(Pi)与Y(Pi)函数返回点Pi的X、Y坐标。则P与Q在二维空间中具有以下8种可能关系,并提供了一个完整的关系覆盖。这些关系定义为:
Restricted_East(Pi,Qj)= X(Pi)>X(Qj) And Y(Pi)=Y(Qj)
Restricted_South(Pi,Qj)=X(Pi)=X(Qj) And Y(Pi)<Y(Qj)
Restricted_West(Pi,Qj)=X(Pi)<X(Qj) And Y(Pi)=Y(Qj)
Restricted_North(Pi,Qj)=X(Pi)=X(Qj) And Y(Pi)>Y(Qj)
North_West(Pi,Qj)=X(Pi)<X(Qj) And Y(Pi)>Y(Qj)
North_East(Pi,Qj)=X(Pi)>X(Qj) And Y(Pi)>Y(Qj)
South_West(Pi,Qj)=X(Pi)<X(Qj) And Y(Pi)<Y(Qj)
South_East(Pi,Qj)=X(Pi)>X(Qj) And Y(Pi)<Y(Qj)
以上8种关系通过点的投影可以精确判断。如有任意两点,上述8种关系必有一种满足。而且,这些关系具有传递性,另外一些关系可进行相互转换(如North_East(PI,QJ)South_West(QI,PJ),通过对上述8种关系进行扩充,可得出另外4种方向关系,即:
East(Pi,Qj)=North_East(Pi,Qj) Or Restricted_East(Pi,Qj) Or South_East(Pi,Qj)
South(Pi,Qj)=South_West(Pi,Qj) Or Restricted_South(Pi,Qj) Or South_East(Pi,Qj)
West(Pi,Qj)=North_West(Pi,Qj) Or Restricted_West(Pi,Qj) Or South_West(Pi,Qj)
North(Pi,Qj)=North_West(Pi,Qj) Or Restricted_North(Pi,Qj) Or North_East(Pi,Qj)
以点目标之间的方向关系为基础,其余目标之间的方向关系可类似定义。
4.3.2方向关系识别
MBR(Minimum Bounding Rectangle)指的是空间目标的外切矩形。MBR的表示非常简单,只需利用两点(左上、右下角点)表示即可。由于MBR的简单、实用性,MBR广泛应用于空间目标数据结构表示以及空间数据查询中。
为了确定目标之间是否具有某种方向关系,首先可判断目标之间的MBR是否具有该关系,然后再利用点/点关系进一步进行关系判断,确定具体的关系。
4.4度量空间关系分析
基本空间对象度量关系包含点/点、点/线、点/面、线/线、线/面、面/面之间的距离。在基本目标之间关系的基础上,可构造出点群、线群、面群之间的度量关系。例如,在已知点/线拓扑关系与点/点度量关系的基础上,可求出点/点间的最短路径、最优路径、服务范围等;已知点、线、面度量关系,进行距离量算、邻近分析、聚类分析、缓冲区分析、泰森多边形分析等。
4.4.1空间指标量算
定量量测区域空间指标和区域地理景观间的空间关系是地理信息系统特有的能力。其中区域空间指标包括:
1)几何指标:位置、长度(距离)、面积、体积、形状、方位等指标;
2)自然地理参数:坡度、坡向、地表辐照度、地形起伏度、河网密度、切割程度、通达性等;
3)人文地理指标:如集中指标、区位商、差异指数、地理关联系数、吸引范围、交通便利程度、人口密度等。
4.4.2地理空间的距离度量
地理空间中两点间的距离度量可以沿着实际的地球表面进行,也可以沿着地球椭球体的距离量算,具体的,距离可以表现为以下几种形式(以地球上两个城市之间的距离为例)(图3-15):
1)大地测量距离:该距离即沿着地球大圆经过两个城市中心的距离。
2)曼哈顿距离:纬度差加上经度差(名字“曼哈顿距离”是由于在曼哈顿,街道的格局可以被模拟成两个垂直方向的直线的一个集合)。
3)旅行时间距离:从一个城市到另一个城市的最短的时间可以用一系列指定的航线来表示(假设每个城市至少有一个飞机场)。
4)词典编纂距离:在一个固定的地名册中一系列城市中它们位置之间的绝对差值。
图3-15:地球上各种形式的距离
5.网络结构模型
5.1网络空间
网络拓扑系统研究的创始人被公认为数学家Leonard Euler,他在1736年解决了当时一个著名的问题,叫做Konigsberg桥问题。图3-16-a显示了该桥的一个概略的路线图。该问题就是找到一个循环的路,该路只穿过其中每个桥一次,最后返回到起点。一些实验表明这项任务是不可能的,然而,从认为没有这样的路线到说明它的步骤并不是这样容易的。
(a) (b)
图3-16:Konigsberg Park中的图形理论模型
Euler成功地证明了这是一项不可能的任务;或者,换一句话来说,这个问题是没有解的。为了做这件事,他建立了该桥的一个空间模型,该模型抽象出了所有的仅有的桥之间的拓扑关系,见图3-16-b。实心圆表示结点或顶点。它们被标上w、x、y、z,并且抽象为陆地面。线表示弧段或边线,它们抽象为陆地之间的直线,并且在每种情况下需要使用一个桥,完整的模型叫做网络或图形。Euler证明了不可能从一个结点开始,沿着图形的边界,遍历每个边界只有一次,最后到达第一个结点。他所采用的论点是非常简单的,依据的是经过每个结点的边的奇数/偶数。我们看到:除了开始的结点和末端的结点外,经过一个结点的路径必须是沿着一个边界进入,又沿着另一个边界出去。这说明了两个边界对应着那个结点。因此,如每个中间结点相连的边界的数量必须是偶数,当然,如果这个问题是有解的话。图3-15中,没有一个结点的边界数是偶数的。因此,这个图论的问题是没有解的,并且与Konigsberg桥问题有关的最初的问题也是无解的。
5.2网络模型
在网络模型中,地物被抽象为链、节点等对象,同时要关注其间连通关系*。基于网络的空间模型与基于要素的模型在一些方面有共同点,因为它们经常处理离散的地物,但是最基本的特征就是需要多个要素之间的影响和交互,通常沿着与它们相连接的通道。相关的现象的精确形状并不是非常重要的,重要的是具体现象之间距离或者阻力的度量。网络模型的典型的例子就是研究交通,包括陆上、海上及航空线路,以及通过管线与隧道分析水、汽油及电力的流动。例如,一个电力供应公司对它们的设施管理可能既采用了一个基于要素的视点,同时又采用了一个基于网络的视点,这依赖于他们关心的是否是替换一个特定的管道,在这种情况下,一个基于要素的视点可能是合适的;或者例如他们关心的是分析重建线路的目的,在这种情况下,网络模型将是合适的。
网状模型的基本特征是,结点数据间没有明确的从属关系,一个结点可与其它多个结点建立联系。网状模型将数据组织成有向图结构。结构中结点代表数据记录,连线描述不同结点数据间的关系。有向图(Digraph)的形式化定义为:
Digraph = (Vertex,{Relation})
其中Vertex为图中数据元素(顶点)的有限非空集合;Relation是两个顶点(Vertex)之间的关系的集合。
有向图结构比树结构具有更大的灵活性和更强的数据建模能力。网状模型可以表示多对多的关系,其数据存储效率高于层次模型,但其结构的复杂性限制了它在空间数据库中的应用。
网状模型反映了现实世界中常见的多对多关系,在一定程度上支持数据的重构,具有一定的数据独立性和共享特性,并且运行效率较高。但它在应用时也存在以下问题:
.网状结构的复杂,增加了用户查询和定位的困难。它要求用户熟悉数据的逻辑结构,知道自身所处的位置。
.网状数据操作命令具有过程式性质。
.不直接支持对于层次结构的表达。
.基本不具备演绎功能。
.基本不具备操作代数基础。
6.时空模型
6.1时空数据模型概述
6.1.1研究概述
传统的地理信息系统应用只涉及地理信息的两个方面:空间维度和属性维度,因此也叫SGIS(Static GIS),而能够同时处理时间维度的GIS叫TGIS(Temporal GIS)。
在GIS中,具有时间维度的数据可以分为两类,一类是可以称为结构化的数据,如一个测站历史数据的积累,它可以通过在属性数据表记录中简单地增加一个时间戳(Time Stamp)实现其管理;另一类是非结构化的,最典型的例子是土地利用状况的变化(图3-17),描述这种数据,是TGIS数据模型的重点要解决的问题。
图3-17:土地利用随时间的推移而变化
TGIS数据模型特点是语义更丰富、对现实世界的描述更准确,其物理实现的最大困难在于海量数据的组织和存取。TGIS技术的本质特点是“时空效率”。当前主要的TGIS模型包括:空间时间立方体模型(Space-time Cube);序列快照模型(Sequent Snapshots);基图修正模型(Base State with Amendments);空间时间组合体模型(Space-time Composite)。其中序列快照模型和GIS分类中的模拟GIS(Analog GIS)一样,只是一种概念上的模型,不具备实用的开发价值,而其它几种模型都有自己的特点和适用范围,如基图修正模型比较适合于栅格模型的TGIS开发。
6.1.2 TGIS的研究思路
TGIS海量数据的处理必然导致数学模型的根本变化。TGIS问题的最终解决在于“可与拓扑论相类比的”全新数学思路的出现。目前可以研究TGIS技术,以便在SGIS的框架中用TGIS技术实现TGIS功能。对TGIS模型的研究可以本着两种思路进行平行探索:综合模型和分解模型。先用分解模型思路针对典型应用领域(如土地利用动态监测工作)进行全面研究,同时不断丰富、充实综合模型,最后得到一个比较完善的综合模型。
6.2时空数据模型设计的基本思想
地籍变更、海岸线变化、土地城市化、道路改线、环境变化等应用领域,需要保存并有效地管理历史变化数据,以便将来重建历史状态、跟踪变化、预测未来。这就要求有一个组织、管理、操作时空数据的高效时空数据模型。时空数据模型是一种有效组织和管理时态地理数据,属性、空间和时间语义更完整的地理数据模型。
一个合理的时空数据模型必须考虑以下几方面的因素:节省存储空间、加快存取速度、表现时空语义。时空语义包括地理实体的空间结构、有效时间结构、空间关系、时态关系、地理事件、时空关系。时空数据模型设计的基本指导思想:
(1)根据应用领域的特点(如宏观变化观测与微观变化观测)和客观现实变化规律(同步变化与异步变化、频繁变化与缓慢变化),折中考虑时空数据的空间/属性内聚性和时态内聚性的强度,选择时间标记的对象。对于属性,有属性数据项时间标记、实体时间标记、数据库时间标记;对于空间,有坐标点时间标记、弧段时间标记、实体时间标记、数据库时间标记。
(2)同时提供静态(变化不活跃)、动态(变化活跃)数据建模手段(静态、动态数据类型和操作)。当前、历史等不同使用频率的数据分别组织存放,以便存取。一般地,将当前数据存放在本地机磁盘上,而将历史数据存放在远程服务器大容量光盘上。
(3)数据结构里显式表达两种地理事件:地理实体进化事件和地理实体存亡事件。地理事件以事件发生的相关源状态和终止状态表达。构成地理实体存亡事件的源状态有参加事件的实体标识集合表示。时间的本质为事件发生的序列,地理事件序列直接表明地理时间语义。常见的状态变化查询即地理事件查询。
(4)时空拓扑关系一般指地理实体空间拓扑关系的拓扑事件间的时态关系。时空拓扑关系揭示了地理实体在时间和空间上的相关性。为了有效地表达时空拓扑关系,需要存储空间拓扑关系的时变序列。
7.三维模型
目前随着计算机技术的飞速发展和计算机图形学理论的日趋完善,GIS作为一门新兴的边缘学科也日趋成熟,许多商品化的GIS软件功能日趋完善。但是,绝大多数的商品化GIS软件包还只是在二维平面的基础上模拟并处理现实世界上所遇到的现象和问题,而一旦涉及到处理三维问题时,往往感到力不从心,GIS处理的与地球有关的数据,即通常所说的空间数据,从本质上说是三维连续分布的。从事关于地质、地球物理、气象、水文、采矿、地下水、灾害、污染等方面的自然现象是三维的,当这些领域的科学家试图以二维系统来描述它们时,就不能够精确地反映、分析或显示有关信息。三维GIS的要求与二维GIS相似,但在数据采集、系统维护和界面设计等方面比二维GIS要复杂得多。
7.1三维GIS的功能
目前,三维GIS所研究的内容以及实现的功能主要包括:
1)数据编码:是采集三维数据和对其进行有效性检查的工具,有效性检查将随着数据的自然属性、表示方法和精度水平的不同而不同。
2)数据的组织和重构:这包括对三维数据的拓扑描述以及一种表示法到另一种表示法的转换(如从矢量的边界表示转换为栅格的八叉树表示)。
3)变换:既能对所有物体或某一类物体,又能对某个物体进行平移、旋转、剪裁、比例缩放等变换。另外还可以将一个物体分解成几个以及将几个物体组合成一个。
4)查询:此功能依赖于单个物体的内在性质(如位置、形状、组成)和不同物体间的关系(如连接、相交、形状相似或构成相似)。
5)逻辑运算:通过与、或、非及异或运算符对物体进行组合运算。
6)计算:计算物体的体积、表面积、中心、物体之间的距离及交角等。
7)分析:如计算某一类地物的分布趋势,或其它指标,以及进行模型的比较。
8)建立模型。
9)视觉变换:在用户选择的任何视点,以用户确定的视角、比例因子、符号来表示所有地物或某些指定物体。
10)系统维护:包括数据的自动备份、安全性措施、以及网络工作管理。
7.2三维数据结构
三维数据结构同二维一样,也存在栅格和矢量两种形式。栅格结构使用空间索引系统,它包括将地理实体的三维空间分成细小的单元,称之为体元或体元素。存储这种数据的最简单形式是采用三维行程编码,它是二维行程编码在三维空间的扩充。这种编码方法可能需要大量的存储空间,更为复杂的技术是八叉树,它是二维的四叉树的延伸。三维矢量数据结构表示有多种方法,其中运用最普遍的是具有拓扑关系的三维边界表示法和八叉树表示法。
7.2.1八叉树三维数据结构
用八叉树来表示三维形体,既可以看成是四叉树方法在三维空间的推广,也可以是用三维体素列阵表示形体方法的一种改进。八叉树的逻辑结构如下:假设要表示的形体V可以放在一个充分大的正方体C内,C的边长为2的n次方,形体VC,它的八叉树可以用以下的递归方法来定义:八叉树的每个节点与C的一个子立方体对应,树根与C本身相对应,如果V=C,那么V的八叉树仅有树根,如果V不等于C,则C等分为八个子立方体,每个子立方体与树根的一个子节点相对应。只要某个子立方体不是完全空白或完全为V所占据,就要被八等分,从而对应的节点也就有了八个子节点。这样的递归判断、分割一直要进行到结点所对应的立方体或是完全空白,或者是完全为V占据,或是其大小已是预先定义的体素大小,并且对它与V之交作一定的“舍入”,使体素或认为是空白的,或认为是V占据的。
如此所生成的八叉树上的节点可分为三类:
1)灰节点,对应的立方体部分地为V所占据;
2)白节点,所对应的立方体中无V的内容;
3)黑节点,所对应的立方体全为V所占据。
后两类又称为叶结点。由于八叉树的结构与四叉树的结构是非常相似的,所以八叉树的存储结构方式可以完全沿用四叉树的有关方法。根据不同的存储方式,八叉树也可以分别称为常规的、线形的、一对八的八叉树等等。
1)规则的八叉树
八叉树的存储结构是用一个有九个字段的记录来表示树中的每个结点,其中一个字段用来描述该结点的特性,其余的八段用来作为存放指向其八个子结点的指针。这是最普通使用的表示树形数据的存储结构方式。规则八叉树缺陷较多,最大的问题是指针占用了大量的空间。因此,这种方式虽然十分自然,容易掌握,但在存储空间的使用率方面不很理想。
2)线形八叉树
线形八叉树注重考虑如何提高空间利用率,用某一预先确定的次序遍历八叉树,将八叉树转换成一贯线形表,表的每个元素与一个结点相对应。线形八叉树不仅节省存储空间,对某些运算也较为方便。但是为此付出的代价是丧失了一定的灵活性,如图3-18和图3-19所示。
图3-18:体元形式的三维数据
图3-19:图3-18的线性八叉树编码
3)一对八式的八叉树
一个非叶结点有八个子节点,为了确定起见,将它们分别标记为0,1,2,3,4,5,6,7。从上面的介绍可以看到,如果一个记录与一个结点相对应,那么在这个记录中描述的是这个结点的八个子结点的特征值。而指针给出的则是该八个子结点所对应记录的存放处,而且还隐含地假设了这些子结点记录存放的次序。也就是说,即使某个记录是不必要的,那么相应的存储位置也必须空闲在那里,以保证不会错误地存取到其它同辈结点的记录。这样当然会有一定的浪费,除非它是完全的八叉树,即所有的叶结点均在同一层次出现,而在该层次之上的所有层中的结点均为非结点。为了克服这种缺陷,一是增加计算量,即在存取相应结点记录之前,首先检查它的父结点记录,看一下之前有几个叶结点,从而可以知道应该如何存取所需结点记录。这种方法的存储需求无疑是最小的,但是要增加计算量;另一个是在记录中增加一定的信息,使计算工作适当减少或者更方便。例如在原记录中增加三个字节,一分为八,每个子结点对应三位,代表它的子结点在指针指向区域中的偏移。因此,要找到它的子结点的记录位置,只要固定地把指针指向的位置加上这个偏移值(0-7)乘上记录所占的字节数,就是所要的记录位置,因而一个结点的描述记录为:
偏移
指针
SWB
SWT
NWB
NWT
SEB
SET
NEB
NET
用这种方式所得到的八叉树和以前相同,只是每个记录前多了三个字节。
7.2.2三维数据的显示
三维显示通常采用截面图、等距平面、多层平面和立体块状图等多种表现形式,大多数三维显示技术局限于CRT屏幕和绘图纸的二维表现形式,人们可以观察到地理现象的三维形状,但不能将它们作为离散的实体进行分析,如立体不能被测量、拉伸、改变形状或组合。借助三维显示技术,通过离散的高程点形成等高线图、截面图、多层平面和透视图,可以把这些最初都是人工完成的工作,用各种计算机程序迅速高效地完成。图3-20给出了一种三维数据的表示方法。
图3-20:通过“围墙”状的剖面表示三维数据