第 8章 数据库技术的发展
? 应用需求和计算机技术推动数据库技术发展。
? 速度快、热点多、新技术层出不穷。
? 学习本章,要求了解数据库技术的发展基本情
况,同时对分布式数据库、数据仓库,WEB数
据库、新一代关系型数据库、面向对象数据库、
多媒体数据库作较深了解。
第 8章 数据库技术的发展主要内容
? 8.1 数据库技术发展概述
? 8.2 数据仓库与数据挖掘
? 8.3 分布式数据库与网络数据库
? 8.4 并行数据库与分布式数据
? 8.5 面向应用领域的数据库新技术
? 8.6 RDBMS产品发展介绍
? 8.7 小结
? 8.8 习题
8.1 数据库技术发展概述
? 数据库技术产生于 20世纪 60年代中期,只有 30
年的历史,但发展速度快,应用范围广。
? 在应用需求的推动下,从第一代网状、层次数
据库,第二代关系数据库,以展到了第三代以
面向对象为主要特征的数据库系统。
? 数据库技术与网络通信技术、人工智能技术、
面向对象程序设计技术、并行计算机技术等相
互渗透结合,构成了当前数据库技术发展的主
要特征。
8.1.1 数据库技术发展概况图
8.1.2 数据模型的发展
? 数据模型是数据库系统的核心和基础 。 数据模型的发展经
历了格式化数据模型 ( 包括层次模型和网状模型 ), 关系
模型, 正走向面向对象的数据模型等非传统数据模型 。
? 按数据模型的进展, 数据库技术的发展分为三个阶段:
? 第一代数据库系统支持网状和层次模型 。
? 第二代数据库系统支持关系模型, 以关系代数和关系理论
为基础, 具有形式基础好, 数据独立性强, 语言非过程化
等特点 。
? 第三代 (新一代 )数据库技术以提供更丰富的数据模型和更
强大的数据管理功能为特征,主要发展方向是面向对象和
支持 Internet。
8.1.2 三代数据库比较表
第一代 DBS 第二代 DBS 新一代 DBS(OODBS)
数据模型 层次网状(格式化) 关系模型 支持面向对象模型
特征 支持三级模式结构 。
用存取路径表示数
据间联系 。
独立的数据定义语
言 。
导航的数据操纵语
言 。
概念单一, 实体及实体
之间的联系用关系表示 。
以关系代数为基础, 数
据形式化基础好 。
数据独立性强, 数据的
物理存储和存取路径对
用户隐蔽 。
关系语言非过程化, 面
向集合操作 。
对象标识 。
封装 。
类和类层次 。
继承 。
代表 IMS层次数据库系
统,DBTG网状数
据库系统。
FOX, FOXPRO,
ORACLE7.3等 。
VFP,ORACLE高级版
本 。
8.1.3 应用领域的发展
? 实际应用需求和硬件平台的发展是推动数据库
技术发展的原动力。数据库技术应用到特定领
域中,推动了新一代数据库技术的产生和发展。
? 出现了:数据仓库、工程数据库、统计数据库、
空间数据库
? 新一代数据库技术都带有 OO模型的特征,是
对关系数据库系统的扩充和革新,它要求具有
更高的造模能力,能适合各种应用需求,具有
更高的可扩充性。
8.1.4 与其他计算机技术的结合
? 数据库技术与其它相关技术相结合, 形成了:
? 分布式数据库 ( 网络技术 )
? 并行数据库 ( 并行技术 )
? 多媒体数据库 ( 多媒体技术 )
? 对象 -关系数据库 ( 面向对象技术 )
8.2 数据仓库与数据挖掘技术
? 8.2.1 操作型处理和分析型处理的比较
? 8.2.2 传统 DSS的问题和数据仓库的产生
? 8.2.3 数据仓库概念
? 8.2.4 联机分析处理( On-Line Analytical
Processing,OLAP)工具和数据挖掘( data
mining,DM)工具。
8.2.1 操作型处理和分析型处理比较
操作型处理 分析型处理
性能特性不同 数据存取操作频率高, 每次
操作处理时间短, 要求较短
的响应时间, 可按分时方式 。
需要连续运行几个小时, 从而
消耗大量的系统资源 。
数据集成性问

一般只需要与本部门有关的
当前数据, 集成性要求较少 。
迫切需要集成数据, 企业内部,
外部和竞争对手等信息 。
数据动态集成
性问题
不需要动态集成, 也不具有
动态集成的能力 。
需要以一定的周期进行动态集
成 。
历史数据问题 一般只需要当前数据, 数据
库中只保存短期数据 。
需要对大量的历史数据进行分
析 。
综合数据问题 积累了大量的细节性数据,
但很少对数据进行综合 。
不是对细节性数据进行分析,
而是要进行不同程度的综合,
对综合信息进行分析 。
8.2.2 传统 DSS的问题和 DW的产生
? 新的 DSS以 DW 为核心,以 OLAP和数据挖掘工
具为手段,是一个集查询、报表和 OLAP技术为
一体的智能决策支持系统,可将数据库、数据
仓库和网络技术有机地结合起来,充分利用企
业数据资源,给用户提供一个丰富的、易于访
问的数据仓库,并利用集成化的在线分析处理
(OLAP)、数据挖掘 (DM)技术,为广大用户提供
切实可行的决策支持。
8.2.3 数据仓库概念及特征
? 数据仓库是一个面向主题的、集成的、稳定的、
不同时间的数据集合,用以支持经营管理过程
中的决策制订过程。
? 数据仓库特征是有四个方面:
? 面向主题
? 集成
? 稳定
? 随时间变化。
8.2.4 OLAP工具和数据挖掘
? OLAP工具
? 数据挖掘
8.3 分布式数据库
? 分布式数据库( Distributed Data Base
System,DDBS)系统
? 8.3.1 分布式数据库的特点
? 8.3.2 分布式数据库的优缺点
? 8.3.3 DDBS的体系结构
8.3.1 分布式数据库的特点
? ( 1) 数据具有物理分布性 。 即数据库中的数据不是集
中存储在一个地区的一台计算机上, 而是分布在不同场
地的计算机上 。
? ( 2) 数据逻辑整体性 。 虽然数据库物理上是分布的,
但在逻辑上却是一个相互联系的整体 。
? ( 3) 数据具有分布独立性 。
? ( 4) 场地自治与协调 。 系统中的每个结点都具有独立性,
能执行局部应用, 同时每个结点又是整个系统的一部分,
可通过网络执行全局应用 。
? ( 5) 数据具有一定的冗余, 冗余是透明性 。
8.3.2 分布式数据库的优缺点
? 优点,
? ( 1)分布式控制。
? ( 2)数据共享。
? ( 3)可靠性和可用性得到加强。
? ( 4) 性能得到改善。
? ( 5) 可扩充性好。
? 缺点,更复杂。系统开销大。
8.3.3 DDBS的体系结构
8.4 并行数据库
? 并行处理技术是利用多个处理器来共同完成一项任务,
是计算机技术一个重要的发展方向。
? 并行数据库是数据库技术与并行处理技术相结合的产物。
? 并行数据库系统( Parallel data base system)以高性能 (线
性加速比 )、高可用性与高扩充性 (线性伸缩比 )为目标,
充分利用多处理器平台的能力,通过多种并行性,在联
机事务处理与决策支持应用两种典型环境中提供优化的
响应时间与事务吞吐量。
? 体系结构主要有:第一类是紧耦合全对称多处理器 (SMP)
系统 。 第二类是松耦合群集机系统 。 第三类是大规模并
行处理 (MPP)系统 。 第四类是混合结构 。
8.5 面向应用领域的数据库新技术
? 8.5.1 多媒体数据库
? 8.5.2 工程数据库
? 8.5.3 统计数据库
? 8.5.4 空间数据库
8.5.1 多媒体数据库
? 数字、字符等称为格式化数据,文本、图形、图
象、声音、视象等称为非格式化数据。非格式化
数据具有大数据量、处理复杂等特点。
? 多媒体数据库 (multimedia database)就是能实现
对格式化和非格式化的多媒体数据进行存储、管
埋和查询等处理的数据库。
? 主要特征,( 1) 能够表示多种媒体的数据 ; ( 2)
能够协调处理各种媒体数据 ; ( 3) 提供非格式
化数据查询的搜索功能 ; ( 4) 提供特种事务处理
与版本管理能力 。
8.5.2 工程数据库
? 工程数据库是一种能存储和管理各种工程图形, 并能为工
程设计提供各种服务的数据库 。 工程数据库适用于 CAD/CAM、
CIM等工程应用领域, 能处理结构复杂的工程对象 。 工程数
据库管理系统是用于支持工程数据库的数据库管理系统,
与传统数据库管理系统有很大不同, 主要应具有以下功能:
支持复杂多样的工程数据的存储和集成管理;支持复杂对
象的表示和处理;支持变长结构数据实体的处理;支持多
种工程应用程序;支持模式的动态修改和扩展;支持设计
过程中多个不同数据库版本的存储和管理;支持工程长事
务和嵌套事务的处理和恢复 。
8.5.3 统计数据库
? 统计数据库是一种用来对统计数据进行存储,
统计 ( 如平均值, 最大值, 最小值, 总和等 ),
分析的数据库系统 。 统计数据具有以下特点:
? (1) 多维结构是最基本特点;
? (2) 是一定时间期未产生的大量数据, 具有
,大进大出, 特点;
? (3) 时间向量性;
? (4) 随着用户对所关心的问题的观察角度不同,
统计数据查询出后常有转置的要求 。
8.5.4 空间数据库
? 空间数据库是以描述空间位置和点, 线面体特征的拓扑
结构的位置数据及描述这些特征的性能的属性数据为对
象的数据库 。
? 位置数据为空间数据, 是用于表示空间物体的位置, 形
状, 大小, 分布特征等信息的数据, 用于描述所有的二
维, 三维和多维分布的关于区域的信息, 它不仅表示物
体本身的空间位置及状态信息, 还具有表示物体空间关
系的信息 。
? 属性数据为非空间数据, 主要包含表示专题属性和质量
描述数据, 用于表示物体的本质特征, 以区别地理实体 。
? 空间数据库研究始于 20世纪 70年代的地图制图和遥感
图象处理领域,目前主要在 GIS中应用。
8.6 RDBMS产品实例
? RDBMS产品众多, 性能各有差别 。
? 各 RDBMS产品不断发展 。
? 要求解 RDBMS产品发展的一般情况 。
? 要求了解各产品的基本情况, 重点了解 SQL
SERVER,ORACLE产品 。
8.6.1 RDBMS主要产品实例
? ORACLE英 Oracle中文
? SQL SERVER
? DB2( IBM)
? SYSBASE
? INFORMIX
? INGRES
? MySQL
? 等
8.6.2 RDBMS产品发展概述
? 关系数据库理论研究和原型开发在 20世纪 70年代得到了
迅速发展 。 70年代未以来的 DBMS产品 90%采用关系模型 。
? RDBMS产品经历了从集中到分布, 从单机环境到网络,
从支持信息管理到联机事务处理 ( OLTP), 再到联机事
务分析处理和数据仓库的发展过程 。 对关系模型的支持
逐步完善, 系统功能不断增强 。
? RDBMS产品的发展可粗略分为四个阶段 。 ( Y表示完全支
持; B表示部分支持; X表示不支持 。 )
8.6.2 RDBMS产品四个发展阶段比较
第一阶段 20
世纪 70年代
第二阶段 20
世纪 80年代
第三阶段 20
世纪 90年代
第四阶段 90
年代后期
对关系模型
的支持
表结构 y Y y Y
关系操作 B Y y Y
完整性 X b y y






单用户 ( 微机 ) x Y y y
多用户 ( 大中型机 ) y 多平台多 OS y y


单机联网 x y y Y
分布式数据 x b y Y
客户 /服务器数据库 x x y Y


网络环境下异构数据
库的互联互操作
x x y Y
系统构成 RDBMS核心 y y y Y
开发工具 x y y Y
对应用的支

信息管理 b y y Y
联机事务处理 OLTP x y y Y
整个企业 /行业的 OLTP x x B Y
OLAP,辅助决策 x x B Y
数据仓库应用 x x B Y
Internet应用 x x B Y
8.7 小结
? 数据库技术受应用需求和软硬件平台的推动发展 。
? 发展体现在三个方向上:数据模型方面; 应用环境支持
和与其他计算机技术紧密结合; 应用领域和层次方面 。
? 面向对象数据库技术使数据库具有更高的处理能力 。
? 分布式数据库是数据库技术与网络技术的结合, 受
Internet的影响, 基于 Internet&Intranet数据库应用是
一个主要的发展方向 。
? 数据仓库对决策支持系统的开发具有重要的作用 。
? 此外,还有多媒体数据库、工程数据库、空间数据库等。
8.8 习题
? 8.1 推动数据库发展的动力是什么?
? 8.2 数据库技术当前主要向哪些方向发展?
? 8.3 什么是面向对象数据库? 有何特点?
? 8.4 什么是数据仓库? 有何特点?
? 8.5 什么是分布式数据库? 它的体系结构如何?
? 8.6 并行数据库与分布式数据有何不同?