我们借助于外感官(我们意识的一种性质)表象给我们自己外面的对象,这些对象毫无例外的在空间里面。这些对象的形状、大小、以及它们相互间的关系是在空间里被规定的或能够在空间里被规定的。
空间不是一个从外部经验得来的经验概念。因为为使着某种感觉与我以外的某些东西发生关系,以及同样地为着我能把那些感觉表象为互相在外、互相靠近,从而不只是彼此不同,并且是在不同的地方,这样就一定要以空间观念为前提。
康德
第二章 从现实世界到比特世界
导读:本章从空间认知的角度讲述了对现实世界进行抽象的过程。空间认知属于行为地理学的范畴,它研究个体如何对现实世界进行认知,并在意识中编码的过程。在认识的基础上进行逐步抽象,最后得到数字化的空间数据,这正是OpenGIS九层抽象模型前五层所描述的内容。最后是空间数据库模型,进一步强调了该抽象过程。
本章的内容有助于加深对空间数据和空间信息的理解。
从现实世界到人的概念世界,再到数字世界,最后通过用户改造自然的活动反馈到现实世界,这中间三个阶段对应着地球信息科学的三个研究领域,即地理认知模型的研究、地理概念计算方法的研究以及地理信息与社会的研究。如图2-1所示。
图2-1: 地理信息流与地理信息科学三个领域
1.对现实世界的地理认知
地理环境是复杂多样的,要正确地认识、掌握与应用这种广泛而复杂的信息,需要进行去粗取精、去伪存真的加工,这就要求对地理环境进行科学的认识。对于复杂对象的认识是一个从感性认识到理性认识的一个抽象过程。对于同一客观世界,不同社会部门或学科领域的人群,往往在所关心的问题、研究的对象等方面存在着差异,这就会产生不同的环境映象。
1.1认知的含义
认知属于心理学的范畴。认知理论早在70年代就被引入地图学,并用“刺激——反应”的关系模式来研究用图者在读图时的心理——物理反应。始于90年代的地图制图可视化研究也应用了认知概念,使“刺激——反应”模式的研究向纵深推进了一步,地图制图可视化的实质是探讨地图信息传输过程中人对空间客体的认识。根据空间信息分析以及空间信息可视化的需要,认知应该是知觉、注意、表象、记忆、学习、思维、语言、概念形成、问题求解、情绪、个性差异等有机联系的信息处理过程。
在简单的认知系统中,感知系统从外界环境输入刺激、进行变换整合,提取刺激特征加以组合,输出经编码的物理刺激。长时记忆系统将输入的经编码的物理刺激与系统只能感知的信息进行比较与模式匹配,一部分信息被激活,这部分被激活的信息送入短时记忆系统。短时记忆系统对输入的有限信息进行精细加工,通过反映系统来输出动作、语言、表情等。中枢处理器进行系统控制和处理,决定目标先后次序和监督当前目标执行,图2-2描述了空间认知的框架。
图2-2:空间认知
空间认知
地理学家和心理学家对空间进行了大量研究,得到了许多有趣的结论,它们成为行为地理学中研究人的空间决策的基础;在GIS中研究空间认知,可以指导建立更加符合人类思维的空间模型和信息表现方式。下面介绍的是与空间认知有关的知识。
1)个体的空间认识的形成和发展
J.Piaget认为,空间认识具有四个层次:感觉运动(Sensorimotor)的层次,它以行动的表象为依据;前运算期(Pre-operational)的层次,其基础是从记忆中获得的有关客观世界的知觉的映象;形象运算(Concrete Operational)的层次,其中允许符号化、系统化的环境心理表象;形式运算(Formal Operational)的层次,在该层次中,个体具有假设——演绎推理能力,能够处理独立于行动、客体、空间的抽象的空间概念。图2-3表示了个体成长过程中的空间认识的发展。
图2-3:空间意识的个体发育
2)意识中的空间信息编码[Elisabeth S. Nelson]
关于个体意识中的空间信息的编码方式,主要有三种理论:命题理论(Propositional Theory),图像理论(Imagery Theory)和双重编码理论(Dual-coding Theory)。
(2.1)命题理论
一个命题,是表达了对象之间关系的概念结构。命题必须符合以下规则:它必须是抽象的;它必须与一个真值关联;它必须符合一定的形式化规则。按照命题理论,空间编码形如以下的单句“俄克拉荷马在德克萨斯以北”,命题理论的关键是认为其命题只是对抽象的意义编码,而非信息的自然特征。
(2.2)图像理论
图像理论认为,在空间认知中,图像是其关键构成。其理论的基础是一个图片的隐喻,认为个体感知并处理空间信息,然后将其组织成为简单的、更加有序的形式。这些信息被记忆,并且可以在需要时重新编排生成图像。
(2.3)双重编码理论
双重编码理论认为语言的和视觉的信息被独立的处理,但是相关的处理系统相互连接。一个图像系统组织各种简单的图像,形成层次结构并且可以输出为空间的形式;而语言系统并行地处理各种非视觉信息,并组织成为更高层次的、连续的结构。
地理信息系统就是信息加工系统,即输入信息,进行编码,存储记忆、做出决策、输出结果。这就是环境信息流在人的大脑中的处理过程被地理信息系统所模拟和复制的原因,当然,认知的目的在于求解问题,即找到问题的解决方案。认知操作包括常规问题求解和创造性问题的求解。
1.2环境映象与模型
环境映象可以看作是被学习到的稳定的思维概念,它总结了个人对环境的认识、评价和选择能力,对任何人与环境相互作用的调查研究来说,理解大脑处理使用什么样的信息就显得至关重要。人与环境相互作用的关系见图2-4所示。
图2-4:人与环境的相互作用关系图
在环境映象研究中,如何从个人那里提取对大尺度环境有意义的信息?如何展现该信息,以便使个人的认知范围和程度明朗化?如何分析这些信息?最为普遍的方法是绘制描述环境要素的简图,通过描述环境要素的序列、要素之间的联系和差异、映象的类型、细节和规模的变化等来提供信息,即构造模型。在科学研究中,经常用模型作为实际对象的代替物或模拟物,它们与被研究的对象之间存在某种程度的一致或相似的映射关系:借助模型所获得的结论和推论又可转用于实际对象上。地理学中所采用的表现模型多种多样,例如各种地图、航空和航天遥感图像、统计图表、剖面图等,但是地图是地学中使用最普遍、也是最重要的模型。从模型的特性和实质来看,地图是客观世界的形象/符号/概括模型。单幅地图是模拟客观实际的某一方面的模型,而系列地图和地图集属于高层次的模型,即地理系统的模型,它们模拟的是自然要素和社会经济要素的总体,反映出这些要素的相互联系、相互作用、解析特征与综合效果、现状与未来发展趋势,以及它们所形成的复杂巨系统的功能特征等。
1.3地图认知模型
地图认知模型分为地图编制与设计者的认知模型和地图使用者的认知模型(图2-5和图2-6)。
图2-5:地图编制者的认识模型
图2-6:地图使用者的认识模型
制图者的认知模型强调对所表达事物和现象的认知,以及对表达内容的表现形式的认知。制图者认知的目的是指导制图者选取最主要的制图内容与最适合的表现形式,以高效地传输空间信息(图2-7)。
地图使用者的认知是在已有地图的基础上,结合读图者的自身的空间知识与背景,完成对地图对象的认知,从而间接达到认知客观世界的目的。
图2-7:制图活动过程
1.4地理客体的科学认知
地理认知是地理信息传输过程中一个子系统。它偏重于心理感知和分析,认知者既感知图上明显的信息也挖掘潜在的信息,不仅仅是探测、识别或区分信息,更要主动地解译信息,形成对客观世界的整体认识。从地图学者在编制地图时的地理认知,到用图者在读图时的地理认知,这整个过程反映了人对地理课题的认识由浅入深的特点。因为从原始制图资料到地图再到新地图的地理信息传输过程,正是人们对地理事物的认知深度的螺旋式上升过程。地理认知不仅是地理模型的基础,而且也是制图概括的基础。
在地理认知的基础上对真实世界的信息进行抽象和概括,形成地理信息系统中的模型,在一定比例尺下显示地理要素的分类、分级和空间图形格局。地图模型本身就是一个主观与客观相统一的过程,GIS专家在地理认知中不仅全面、综合地分析和理解地理环境,而且其认知中还包括了对一些客观的模拟标准和规范的接受或认同。
此外,地理认知贯穿于制图概括的整个过程。具体来看,它表现在地图设计阶段,对制图概括原则、内容、分类分级指标的“构思”上,以地理认知中所获得的关于地理环境的系统功能、层次结构、各个要素的组合关系等的知识为指导。在地图编绘阶段,对地图要素的选取、数量和质量概括、图形简化等“构图”操作上,在处理符合概括指标的要素或图形时能够进一步体会地理认知的控制和指导作用,做到心中有数,操作正确,不至于误解概括指标和规则。
1.5地图是客观世界的形象——符号——概括模型
1.5.1地图是客观世界的形象模型
地图与其它地学模型的主要区别和优点在于它具有形象性,能对实际对象做出完整的、清晰的和直观的图形描述和说明。“地图是地表空间关系和空间形式的视觉图解表象”。
1.5.2地图是客观世界的符号模型
地图区别于其它许多图示模型的又一特征是它采用专门设计和事先规定的符号来反映地物、现象和地理过程,并表示它们的位置、质量特征和数量特征。各种符号的组合便构成一种地图形象,而多种地图形象的汇集便组成一幅完整的地图图形。地图符号的作用并不仅仅局限于传输信息,它们还是记录知识、使知识定型并系统化的强大工具。
1.5.3地图是客观世界的概括模型
地图不是客观对象的完全再现,而是通过地图制图工作者脑和手的“过滤”、概括和抽象出来的模型。对地物进行取舍、图形化简、数量和质量概括、地物协调,以及夸大表示等处理,是地图学者对地物进行深刻理解、综合分析并抽象概括等一系列复杂的科学思维和创造性劳动的结果。因此,对制图对象进行地图概括是地图作为客观实际模型的一个最重要的特征。
2.现实世界的抽象
对地理对象的抽象过程通常认为有9个层次[OGC],在这九个层次之间通过8个接口与它们连接,定义了从现实世界到地理要素集合世界的转换模型。这9个层次依次为现实世界(Real World)、概念世界(Conceptual World)、地理空间世界(Geospatial World)、尺度世界(Dimensional World)、项目世界(Project World)、点世界(Points World)、几何体世界(Geometry World)、地理要素世界(Feature World)以及要素集合世界(Feature Collection World)(图2-8)。连接它们的8个接口分别为认识(Epistemic)接口、GIS学科(GIS Discipline)接口、局部测度(Local Metric)接口、信息团体(Community)接口、空间参照系(Spatial Reference)接口、几何体结构接口、要素结构接口及项目结构接口。其中前五个模型是对现实世界的抽象,并不在计算机软件中被实现;后四个模型是关于真实世界的数学的和符号化的模型,将在软件中被实现*。
图2-8:OpenGIS的九层模型
2.1现实世界
现实世界是所有事物(Fact)的集合,无论人们是否知道这些事物。根据事物的本质,人们可以认识理解现实世界中的事物。图2-9表示了人类生活于其中的现实世界。象云一样的纹理结构占据了图形的绝大部分,代表了人们所不了解的事物,而且它们造成了宇宙的混沌状态。人们只知道一些所熟悉的事实,其中的一些被绘制在图中。
图2-9:现实世界
2.2概念世界
概念世界是人类自然语言的世界,人类了解且认识其所命名的事物,因此这些事物构成了“语言的世界”。在图2-10的概念世界中,表示宇宙混沌状态的云并不存在,因为这些在自然语言内容中通常是不可见的。示意图显示了容易识别的事物:门、路、砖、屋顶、房屋等。用这种方法,可以返回到真实的世界中,抽象出一个事实的本质,称之为精髓(Pith)。由于可以给出所知道的事物的名字,而且能够感受到这些相同的已知事物的本质,所以称真实世界与概念世界之间的交互为认识接口(Epistemic Interface)。
图2-10:概念世界
对于GIS来讲,自然语言的概念世界并不是充分抽象的,在GIS中只有概念世界中一个简化的子集才是兴趣所在。这个子集叫做地理空间世界,人们与概念世界的交互的方法叫选择。
图2-11中,有三种实体类型。每个由一个矩形表示,并且每个用其上部的名字所表示。矩形之间的线代表着实体之间的联系,每条线在末端带有一个作用名以解释这种联系。菱形代表聚合(Aggregation),例如,概念世界的存在依赖于真实世界的存在。实心圆意味着在联系的那个末端存在着一个集合(并不是一个单个的对象),例如,每个概念世界嵌入(Embed)一系列不同的地理空间世界。
图2-11:现实世界与地理空间世界的联系
2.3地理空间世界(Geospatial World)
从事GIS的技术人员都习惯于把世界看作一个抽象的、几乎是具有卡通特性的世界。这是由于在概念层次的世界充满了复杂的形状、样式、细节。这些复杂性在地理空间世界中被消除,并用简单的、浅显的抽象来代替,这些抽象通常在时间以及空间上都是静态的。通过地理空间世界的抽象,河流是被看作线,地形被看作等高线多边形的简化,而森林被看作多边形。
前面描述的概念世界在图2-12中以卡通的方式在地理空间世界水平上被重画。图2-12是以透视的方式绘制的,但是地理空间世界通常是从一个“顶点”来观察,即垂直地从上向下看。注意在图中,一些特征已经消失,另外一些已经变得大大简化。例如,一些窗户、墙、建筑物的房顶已经消失。这是由于它们并不是GIS世界视点的兴趣所在。它们已经成为GIS意识中所不可见的。当然,并不存在一个通用的定义——准确地讲,什么样的特征对于一个GIS技术人员来讲是其兴趣所在,也许有时一个屋顶可能会引起兴趣。卡通仅仅表明地理空间世界是概念世界中的一个子集和一个简化,在地理空间世界中所讲的语言是GIS学科语言。在图中,房屋的地基还保持着,尽管在概念世界中,部分地基被隐藏在其它要素后面。从GIS的观点来看,一个建筑物的所有的地基都是可见的——尽管有些是看不见的。每个GIS实现都有特定的规则,这些规则规定了在地理空间世界中什么样的特征被识别以及它们是如何从概念世界中被简化的。例如,一个规则可以把一个砖房简化为一个三维的多面体;然而具有另一种表面物质的一个房屋被简化为它的地基多边形。简单地讲,在概念世界中不可见的事物在地理空间世界中就变得可见了,因为这些事物在GIS中是特殊兴趣所在。概念世界和地理空间世界之间的交互称为GIS学科接口;从概念空间进行的交互方法叫做选择。为了转换从地理空间到概念世界的这种交互,人们可以采用嵌入(Embed)方法,这种方法把GIS感兴趣的内容放置在概念世界适当的语境(Context)中。
在地理空间世界中所认识的要素通常有一个自然的维度:0、1、2或者3,这取决于它们是否被看成点、线、面、体。此外,根据二元拓扑关系(如包含、相邻或分开),它们还具有另外的量度。下一个层次的抽象识别了要素固有的维度和尺度(Dimensionality and Metrics)特性,因此叫做维度世界,可以通过在欧氏空间中进行工具测量获取要素的尺度。
图2-12:地理空间世界
2.4维度世界(Dimensionality World)
维度世界是地理空间世界的一个抽象,其中包括一些测量工具,如卷尺测量和指南针,在这样的水平上所认识到的事实包括一元(Unary)关系(如一个弧段的长度)和二元(Binary)关系(如两点之间的距离),这些关系本身就是各种要素的抽象。
维度世界与地理空间世界的接口叫做适合(Fit)。两个电话线路杆之间的距离是属于维度世界。这个长度线适合于地理空间世界中所见到的长度跨度,在图2-13中包括了在维度空间所表现的一些抽象。
维度世界是现实世界抽象的最后一个。下一个抽象叫做一个项目世界,该世界只发生在一个具体的实现中,每一个实现都是针对一个特殊的GIS学科或分学科。在每一个实际的实现中,只有维度世界中的一个子集得到识别。通常这个子集是由研究区域的范围和被测量的特定的现象所决定的。
在项目世界的层次中,空间参照系统(Spatial Reference System)的概念被引入,最常见的参照系统是环绕地球表面建立的坐标系统(经纬度);此外,还有其它的间接的参照系统,例如线性参照系统可以用一个参数标识出一条线(如高速公路)上的一个点位。无论采用哪种坐标参照系统,都可以确定维度世界中的要素的每个“角点”的坐标。维度世界和项目世界之间的接口称为信息团体接口,从维度世界调用该接口的方法叫做编码(Codify),其结果是每个“角点”的坐标以一组数值表示;相反的,从项目世界调用的方法称为定位,它确定了每个要素与其他要素的相对关系。
图2-13:维度世界
2.5项目世界(Project World)
有两种常用的方法来对地理空间要素建模。第一个模型定义了点、线、多边形的一个要素的空间范围,以及来自于所熟知的一系列类型的几何基本单元(Primitive),在这种方式下的要素叫做“几何体要素(Features with Geometry)”。
第二种称为覆盖(Coverage),影像是该模型的一个特殊的例子。几何体要素和覆盖是紧密相关的,但是在概念上截然不同*。
要素模型用于对现实世界中的地物对象建模,如道路、城市等等;而覆盖模型则对现象建模,包括:温度、土壤分布等等。一个要素具有多种属性,如空间位置属性,空间关系属性,描述属性,时间属性等等,覆盖也可以视为要素的一种属性。
GIS并不只是一个学科,它还是地理空间信息表现的一门语言,其中这些信息源于许多与地理学科相关的学科,如森林管理、土壤制图、运输模型、地籍管理等等,这些学科中的每一门学科都有许多子学科,一个GIS项目可以包含任何这些学科的组合。
正是项目世界语言的多样性导致了GIS信息存储之间相交互的最复杂的问题。这是人为造成地理空间世界分割的原因。但是,如果对语言结构进行充分地统一化,这种情况是可以管理的。
地理信息团体是指共享数据的用户群,他们属于不同的专业领域,可以是数据使用者,也可以是数据提供者。地理信息团体将整个地理空间世界中的一个特殊的子集看成是一个抽象。在三个不同的应用中,上述的例子被抽象为三个不同的项目世界模型。它们显示在图2-14中,分别反映了一个制图员、一个地籍管理人员和一个道路管理人员视角的项目世界。
图2-14:项目世界
3.比特世界
3.1比特世界
地理信息系统以数字世界表示自然世界,现实世界与数学模型之间的关系见图2-15。
在计算机中,现实世界是以各种符号形式来表达和记录的,计算机在对数字和符号这些符号进行操作时,又将它们表示为二进制形式(比特世界)。因此,基于计算机的地理信息系统不能直接作用于现实世界,必须经过对现实世界的数据描述这一步骤。模型是对现实世界的简化表达,是将系统的各个要素通过适当的筛选,用一定的表现规则描写出来的简明的映象。
图2-15:现实世界与数学模型的关系
一幅地图是一个符号模型,因为它是通过制图学家处理后得到现实世界的简化描述;存储数字地图的计算机文件也是一种符号模型,它以数字代码来表现图形符号。一幅数字地图的产生不仅需要选择所要表现的物体,还要进一步考虑如何对表达它们的数据进行组织。如果数据的组织规则没有很好地建立起来,则一幅数字地图除了对生产这些数据的个人或组织有用以外,对于其他人是没有用的。
数据是对现实世界状况的数字符号记录,信息是经过重新组织的,能揭示现实世界内在机理的并有利于研究工作的数据。如果数据不以空间属性表来组织,则很难从空间数据中抽取出空间信息。由于计算机的数字化特征,数据项必须是离散的以便于进行数字处理和操作,因此,地理空间也必须离散化的表达。数据建模是指把现实世界的数据组织为有用且能反映真实信息的数据集的过程。根据一定的方案建立的数据逻辑组织方式叫数据模型。数据建模过程分为三个步骤:首先,选择一种数据模型来对现实世界的数据进行组织;然后,选择一种数据结构来表达该数据模型;最后,选择一种适合于记录该数据结构的文件格式。可见,一种空间数据建模可能有几种可选的数据模型,而每一种数据结构又可能有多种文件格式进行存储。空间数据可依据它们的采集方式、存储方法、使用目标等,用不同的数据模型进行组织。如GIS中最常用的数据组织方式为矢量模型和栅格模型。在矢量模型中,用点、线、面表达世界,在栅格模型中用空间单元或像元来表达世界。
3.2模型的作用
在地理信息系统中,模型,尤其是数学模型起着十分重要的作用。由于模型是对客观世界中解决各种实际问题所依据的规律或过程的抽象或模拟,因此能有效地帮助人们从各种因素之间找出其因果关系或者联系,有利于问题的解决。模型的建立是数学或技术性的问题,但它必须以广泛、深入的专业研究为基础,专业研究的深入程度决定了所建模型的质量与效果,而模型的质量和数量又决定了系统中数据使用的效率和深度。大量模型的发展和应用,实际上集中和验证了该应用领域中许多专家的经验和知识,这无疑成为一般地理信息系统向专家系统发展的基础。
3.3 GIS空间数据建模
GIS是专门用于采集、存储、管理、分析和表达空间数据的信息系统,它既是表示、模拟现实空间世界和进行空间数据处理分析的工具,也是一门关于空间信息处理分析的科学技术。就GIS的工具特性而言,它是为人们采用数字形式表示和分析现实空间世界提供了一系列空间操作和分析的功能,包括综合地存储管理人们研究和解决空间问题所需的各种空间数据;根据用户的要求查询有关的空间分布信息,进行各种统计量算、列表制图;根据规划、管理、生产的需要,进行多因素的综合研究、决策方案的模拟优化等。所以,GIS一方面应为用户采用数字形式表示和分析空间现象或问题提供空间数据建模及分析操作的手段,另一方面应向用户提供友好的使用界面,便于用户进行空间数据建模、查询、分析等。
空间数据建模的基本任务是,针对所研究的空间现象或问题,描述GIS的空间数据组织,设计GIS空间数据库模式,这包括定义空间实体及其相互间关系,确定数据实体或目标及其关系,设计在计算机中的物理组织、存储路径和数据库结构等。这项工作是以空间数据模型的理论为指导的。空间数据模型是关于现实世界中空间实体及其相互间联系的概念,为描述空间数据组织和设计空间数据库模式提供了基本的方法。
一般而言,GIS空间数据模型由概念数据模型、逻辑数据模型和物理数据模型三个有机联系的层次所组成。其中概念数据模型是关于实体及实体间联系的抽象概念集,逻辑数据模型是表达概念数据模型中数据实体(或记录)及其间关系,而物理数据模型则是描述数据在计算机中的物理组织、存储路径和数据库结构,三者之间的相互关系如图2-16所示。
图2-16:空间数据模型的三个层次
3.4 GIS空间数据模型的概念与分类
3.4.1GIS空间概念数据模型
由于职业、专业等的不同,人们所关心的问题、研究对象、期望的结果等方面存在着差异,因而对现实世界的描述和抽象也是不同的,形成了不同的用户视图,称之为外模式。GIS空间数据模型的概念模型是考虑用户需求的共性,用统一的语言描述和综合、集成各用户视图。目前广为采用的数据模型是基于平面图的矢量数据模型和基于连续铺盖的栅格数据模型。
3.4.2空间逻辑数据模型
逻辑数据模型是根据前述的概念数据模型确定的空间数据库信息内容(空间实体及相互关系),具体地表达数据项、记录等之间的关系,因而可以有若干不同的实现方法。一般来说,可将空间逻辑数据模型分为采用结构化模型和面向操作的模型两大类。
1)结构化逻辑数据模型
结构化模型是显式表达数据实体之间关系的树形结构。其中的层次数据模型是按树型结构组织数据记录,以反映数据之间的隶属或层次关系。网络数据模型是层次数据模型的一种广义形式,是若干层次结构的并,其优点是能反映现实世界中极为常见的多对多的联系,缺点是复杂。一般而言,结构化模型能直接地反映现实世界中空间实体之间的联系。
2)面向操作的逻辑数据模型
关系数据模型是用二维表格表达数据实体之间的关系,用关系操作提取或查询数据实体之间的关系,因此称之为面向操作的逻辑数据模型。其优点是灵活简单,但表示复杂关系时比其它数据模型困难;当数据构成多层联系时,存储空间利用效率较低。当前的一种发展趋势是将两者的优点集中起来,形成新的或改进的逻辑数据模型,如扩展的网络模型。
3.4.3物理数据模型
逻辑数据模型并不涉及最底层的物理实现细节,但计算机处理的是二进制数据,必须将逻辑数据模型转换为物理数据模型,即要设计空间数据的物理组织、空间存取方法、数据库总体存储结构等。
1)物理表示与组织
层次逻辑数据模型的物理表示方法主要有物理邻接法、表结构法、目录法。网络数据模型的物理表示方法主要有变长指针表、位图法、目录法等。关系数据模型的物理表示是用关系表进行的。物理组织主要是考虑如何在外存储器上以最优的形式存放数据,通常要考虑操作效率、响应时间、空间利用和总的开销。
2)空间数据存取
数据库的“存”是指从内存写一块到外存,“取”指从外存写一段到内存。常用的存取方法有:
第一种,文件结构法:包括顺序结构(如二分查找,插值查找)、表结构(线性表,倒排表)和随机结构。
第二种,索引文件:它是提高数据存取效率的基本方法。对索引的插入、删除等只涉及到索引记录本身,而对数据记录的操作要看具体的数据组织策略。如果索引本身很大的话,就要对索引文件再索引,建立多级索引,如B树、B+树等。B树是基于主关键字的索引,若要根据次关键字进行索引,必须建立倒排索引表。但是,如果这种基于次关键字的搜索是主要操作的话,这类索引就不适合了。
第三种,点索引结构:由于B树在进行基于次关键字的搜索时是不适合的,为此,将空间定位数据及其属性看作是多维空间中的点,采用栅格索引、KD树、四叉树、R树等多维点索引结构进行索引。目前空间存取方法及查询优化仍是GIS研究中的一个重要的课题。