,数据库系统概论,
主讲,李明东
第一章 绪 论
1.1 数据管理的进展
(1).人工管理阶段
(2).文件系统阶段
(3).数据库系统阶段
1.1.1 人工管理阶段
这个时期数据管理的主要特点是,
(1).数据不保存,
(2).没有软件系统对数据进行管理,
(3).数据的组织方式须由程序员自行设计,无文件的概验,
(4).一组数据对应一个程序,数据是面向应用的,
上述特点如 P2图 1-1所示,
1.1.2 文件系统阶段
这一阶段的数据管理形成了如下 4个特点,
(1).经常对文件 (数据 )进行查询,修改,插入和删除等操作。
(2).有软件对数据进行管理,使程序与数据有一定的独立性。
(3).文件已经多样化。
(4).数据的存取基本上以记录为单位。
上述各点虽都比第一阶段有很大的改进,但仍有很多缺点,主要有,
(1),数据冗余度大。
(2),数据和程序缺乏独立性。
这个时期程序与数据定关系如图 1-2所示,
应用程序 1 文件 1
应用程序 2 文件 2
存取方法
应用程序 n 文件 n
1.1.3 数据库系统阶段
一、这一时期的背景
1、计算机用于管理的规模更为庞大,应用越来越广泛,数据量
急剧增长,而且数据的共享要求越来越强。
2、有了大容量的磁盘。
3、联机实时处理更多,并开始提出和考虑分布处理。
4、软件价格上升,硬件价格下降。
二、数据库系统的特点
1、面向全组织的复杂的数据结构
2、数据冗余度小,易扩充
3、具有较高的数据和程序的独立性
4、统一的数据控制功能
5、数据的最小存取单位是数据项
综上所述,我们可以说,数据库是个通用化的综合性的数据集合,它
可以供各种用户共享且具有最小冗余度和较高的数据与程序的独立性。
应用程序 1
应用程序 2
应用程序 n
数据库
管理系统
数据库
图 1— 7
1.1.4 数据库技术的发展
一,60年代末到 70年代初出现的三件事
1,1969年 IBM公司研制、开发数据库管理系统的商品化软件
IMS(Information Management System).IMS的数据模型是层次结构的,
2、美国数据系统语言协商会 CODASYL下属的数据库任务组
DBGT对数据库方法进行了系统的研究、讨论。于 60年代末至 70年
代初提出了若干报告,称为 DBTG报告。它是数据库网状模型的基
和典型代表。
3,1970年 IBM公司 San Jose研究实验室的研究员 E.F.Codd发表
题为“大型共享数据库数据的关系模型”论文,提出了数据库的关系
模型。为数据库技术奠定了理论基础。
二,70年代,数据库技术有了很大发展。
三、数据库科学的研究领域 。
1、数据库管理系统软件的研制。
2、数据库设计。
3、数据库理论。
1.2 数 据 模 型
1.2.1 数据模型的三要素
一、数据结构
数据结构是所研究的对象类型 (Object type)的集合, 这些对象
是数据库的组成部分。
二、数据操作
数据操作是指对数据库中各种对象的实例允许执行执行的操
作的集合,包括操作及有关的操作规则。
三、数据的约束条件
数据的约束条件是完整性规则的集合。
1.2.2 概 念 模 型
一、信息世界涉及的主要概念
1、实体
2、属性
3、码
4、域
5、实体型
6、实体集
7、联系
二、两个实体之间的联系
1、一对一联系 (1:1)
2、一对多联系 (1:n)
3、多对多联系 (m:n)
我们可以用图形来表示这三类联系(见图 1-9)
实体型 A 实体型 A 实体型 A
实体型 B 实体型 B 实体型 B
1
1
1
n
m
n
(a).1:1的联系 (b)1:n的联系 (c)m:n的联系
图 1-9 两个实体型之间的联系
联系名 联系名 联系名
三、概念模型最常用的表示方法 —— 实体联系方法( E—— R)
该方法是 P.P.S.Chen于 1976年提出的,该方法是用 E-R图来描述某
一组织的概念模型。
1,E-R图例说明,
( 1)用长方型表示实体型,在框内写上实体名。
( 2)用椭圆形表示实体的属性,并用无向边把实体与其属性
连接起来。
( 3) 用菱形表示实体间的联系,菱形框内写上联系名。
2,举例说明用 E-R图来表示某个工厂的物资管理的概念模型
(1) 物资管理涉及的实体
A.仓库。属性有仓库号,仓库面积,电话号码。
B.零件。属性有零件号,名称,规格,单价,描述。
C.供应商。属性有供应商号,姓名,地址,电话号码,帐号。
D.项目。属性有项目号,预算,开工日期。
E.职工。属性有职工号,姓名,年龄,职称。
这些实体之间的联系为:
供应商
项目 零件
供应量 供应 库存
仓库
库存量
工作 职工
领导
m
p
n
m 1 n
n
1 n
某工厂物资管理实体及其联系图
1.2.3 三种主要的数据模型
当前,实际数据库系统中所支持的主要数据模型有,
.层次模型 (Hierachical Model)
.网状模型 (Network Model)
.关系模型 (Relational Model)
一、基本层次联系
任何一个图可以分解为两点与一边的基本单元,数据库中非
关系模型的数据结构也可以分解为基本层次联系。
Ri
Rj
图 1-16 基本层次层次联系
Lij
二、层次模型
在数据库中,我们定义满足下面两个条件的“基本层次关系”
的集合为层次模型。
1、有且仅有一个结点无双亲,这一个结点为根结点。
2、其他结点有且仅有一个双亲。
R1
R2 R3
R4 R5
图 1-17 层次模型示意图
三、网状模型
1、定义,广义的讲,任意一个连通的基本层次联系的集合是
一个网状模型。在数据库中则把树结构排除在网状模型之外。
在网状模型中。允许:
*有一个以上的结点没有双亲
*结点可以有多于一个的双亲
R1 R2
R3
R4
(a)
R1 R2
R3
R1
R2 R3
R4
(b) ( c )
图 1-18 网状模型示例
2、层次模型与网状模型的不同点:
( 1)层次模型中从子女到双亲的联系是唯一的,而网状模型可以
不唯一。
( 2)网状模型中允许复合链,层次模型则不可以。
R1 R2
R3
L1 L2
图 1-19
Ri
Rj
工 人
设 备
S1 S2 使用 保养
( a ) ( b )
图 1-20 网状模型中的复合链
四、关系模型
在关系模型中,数据在用户观点下的逻辑结构是一张二维表。
关系模型是三种数据模型中最重要的模型。
1、关系模型的主要术语
( 1)关系
( 2)元组
( 3)属性
( 4)主码
( 5)域
( 6)分量
( 7)关系模式
2、关系模型的特点
( 1)、关系模型的概念单一
( 2)、关系必须是规范化的关系
( 3)、在关系模型中,用户对数据的检索操作
不过是从原来的表中得到一张新的表
1.3 数据库系统的结构
1.3.1 数据库系统三级模式结构
数据库系统的三级模式结构由外模式、模式和内模式组成。
应用 A 应用 B 应用 C 应用 D 应用 E
外模式 1 外模式 2 外模式 3
模 式
内模式
数据库
模式 /内模式映象
外模式 /模式映象
图 1-22数据库系统的三级模式
一、模式
模式是数据库中全部数据的一个逻辑表示或描述。
模式是数据库数据在逻辑集上的视图。
数据库系统提供模式描述语言 (模式 DDL)来严格地表示这些内
容。用模式 DDL写出的一个数据库逻辑定义的全部语句称为某一个
数据库的模式。
二、外模式
外模式是个别用户的视图,即与某一应用有关的数据的逻辑表
示。
外模式通常是模式的子集。
数据库系统提供外模式描述语言 (外模式 DDL)描述用户视图。
用外模式 DDL写出的一个用户数据视图的逻辑定义的全部语句成为
此用户的外模式。
课 间 休 息
三、内模式
内模式是全体数据库数据的内部表示或者底层描述,用来定义
数据的存储方式和物理结构。
内模式通常用内模式数据描述语言(内模式 DDL也成为存储模
式 DDL)来描述和定义。
四、二级映象
外模式 /模式的映象定义某一个外模式和模式之间的对应关系。
模式 /内模式的映象定义数据逻辑结构和存储结构之间的对应关
系。
五、概念模式与模式
概念模式是信息世界范畴内的信息结构,而模式是机器世界范
畴内的逻辑表示
概念模式独立于具体计算机系统,是一个部门或组织长期的无
限制的模型。
概念模式和模式都是描述信息或数据的整体结构的。
1.3.2 带有数据库的计算机系统构成
硬件
应用系统
应用开发工具软件
DBMS
编译系统
操作系统
图 1-23 计算机系统层次图
一、硬件及数据库
二、软件
三、人员
终端用户 {
外模式
模式
内模式
应用程序员 {
DBA,
系 统
分析员
数据抽象级别 软件系统层次
应用系统
DBMS
DB OS
图 1-24 各种人员的数据视图
四、数据库管理员( DBA)的职责
1、决定数据库的信息内容和结构
2、定义数据的安全性要求和完整性约束条件
4、监督和控制数据库的使用和运行
5、数据库的改进和重组
进一步地,当用户的需求增加或改变时,
DBA还要对数据库进行较大的改造,包括内模式
和模式的修改,即数据的重构造。
1.3.3 数据库管理系统
数据库管理系统是为数据库的建立、使用和维护而配置的软件。
它建立在操作系统的基础上,对数据库进行统一的管理和控制。
数据库管理系统的主要功能:
1、数据库定义功能
2、数据存取功能
3、数据库运行管理
4、数据库的建立和维护功能
作业,P26 9,11,14题
第 一 章 结 束