第一章 数据库系统概论
第 1章 数据库系统概论
1.1 现实世界的数据化过程
1.2 数据管理技术的发展
1.3 概念模型与数据模型
1.4 数 据 库 系 统
第一章 数据库系统概论
1.1 现实世界的数据化过程
信息世界也叫观念世界, 是现实世界在人脑中的反映 。
现实世界中的事物和事物特性在信息世界中分别反映为实
体和实体的属性 。 人们用概念模型来描述信息世界 。
数据世界是信息世界数据化后的产物 。 信息世界中的
实体和属性在数据世界中分别成为记录和数据项 。 人们用
数据模型来描述数据世界 。
现实世界, 信息世界和数据世界的关系如图 1-1所示 。
第一章 数据库系统概论
现实世界(事物 事物性质)
信息世界(实体 实体属性) 概念模型描述
抽象化
数据化
数据世界(记录 数据项) 数据模型描述
图 1-1 三个世界的关系
第一章 数据库系统概论
数据模型是数据库系统的核心和基础 。 但现实世界
只有先抽象为信息世界, 才能进一步转换为数据世界 。
信息世界的概念模型是不依赖于具体的计算机世界的 。
因此, 概念模型是从现实世界到计算机世界的中间层
次 。
第一章 数据库系统概论
1.2 数据管理技术的发展
1.2.1 人工管理阶段
在硬件方面,计算机的运算速度低、内存容量小,
外设还没有磁盘等直接存取的存储设备;在软件方面,
还没有操作系统,没有管理数据的软件。这一阶段的计
算机主要用于科学计算,这个时期数据管理的特点是:
(1) 数据不保存。
(2) 没有管理数据的软件系统。
(3) 基本上没有文件概念。
(4) 数据是面向应用的。
第一章 数据库系统概论
在人工管理阶段, 上述数据与程序关系的特点如
图 1-2所示 。
用户 m
用户 2
用户 1

应用程序 n
应用程序 3
应用程序 2
应用程序 1 数据组 1
数据组 2
数据组 3
数据组 n
… …
图 1-2 人工管理阶段数据与程序的关系
第一章 数据库系统概论
1.2.2 文件系统阶段
文件系统管理阶段有以下几个特点:
(1) 数据存在文件中, 文件可长期保存在外存 。
(2) 程序和数据有了一定的独立性 。
(3) 文件已多样化 。
(4) 数据的存取基本上以记录为单位 。
第一章 数据库系统概论
在文件系统阶段, 用户虽有了一定的方便, 但仍有
很多缺点 。 这主要表现在以下两个方面:
(1) 数据冗余度大。
(2) 数据和程序缺乏独立性。
文件之间是孤立的, 不能反映现实世界中事物之间
的内在联系 。 在文件系统阶段, 数据与程序的关系如
图 1-3所示 。
第一章 数据库系统概论
用户 m
用户 2
用户 1

应用程序 n
应用程序 3
应用程序 2
应用程序 1 数据文件 1
数据文件 2
数据文件 3
数据文件 n
… …






图 1-3 文件系统阶段数据与程序的关系
第一章 数据库系统概论
1.2.3 数据库系统阶段
20世纪 60年代后期,计算机硬件、软件有了进一
步的发展。
数据库系统 (Data Base System)指在计算机系统中引
入数据库后的系统构成, 由计算机硬件, 操作系统,
数据库管理系统, 数据库, 应用程序和用户, 数据库
管理人员等组成 。
1,数据库 (Data Base)
数据库是存储在计算机系统内的、有结构的数据的
集合。
第一章 数据库系统概论
2,数据库管理系统 (DBMS,Data Base Management
System)
数据库管理系统是数据库系统中管理数据库的系统
软件。它是在操作系统支持下进行工作的,它为用户提
供了一整套命令。
数据库管理系统中, 程序与数据的关系如图 1-4所示 。
第一章 数据库系统概论
用户 m
用户 2
用户 1

应用程序 n
应用程序 3
应用程序 2
应用程序 1








数据库
图 1-4 数据库系统阶段数据与程序的关系
第一章 数据库系统概论
1.3 概念模型与数据模型
1.3.1 概念模型
概念模型中的基本内容是实体 (Entity)。实体是客
观事物的反映,既可以是实际存在的对象,也可以是
某种概念。
事物是有特性的。
概念模型中,任一实体在任一属性上的取值都是
有限制的。
所有属性名完全相同的实体往往集合在一起, 称为实
体集 (Entity Unit)。
第一章 数据库系统概论
1.3.2 实体之间的关联
1,一对一联系 (1∶ 1)
对实体集 A中的每一个实体, 若实体集 B中至多有一
个实体与之联系, 反之亦然, 则称实体集 A与 B是一对
一联系的, 见图 1-5(a)。
第一章 数据库系统概论
A B
实体型 A
实体型 B
联系名
1
1
( a ) 一对一联系
A
B
实体型 A
实体型 B
联系名
1
( b ) 一对多联系
A B
实体型 A
实体型 B
联系名
m
n
( c ) 多对多联系
n
图 1-5 两个实体型之间的联系
第一章 数据库系统概论
2,一对多联系 (1∶n)
对 A中的每一实体, 若 B中可有多个实体与之联系;
但对 B中的每一实体, A中最多有一个实体与之联系,
则称 A与 B是一对多联系的, 见图 1-5(b)。
3,多对多联系 (m∶n)
对 A中的每一实体,若 B中可有多个实体与之联系,
反之亦然,则称 A与 B是多对多联系的,见图 1-5(c)。
同一实体集内的各实体之间也可有某种联系 。 例如,
场上队长与队员之间为一对多的联系, 可用图 1-6表示 。
第一章 数据库系统概论
队员
场上队长
n1 …
图 1-6 同一实体集内一对多联系
第一章 数据库系统概论
1.3.3 概念模型的表示方法 —— E-R图
概念模型的常用表示方法是实体 — 联系法 (Entity-
Relationship Approach),即 E-R图。
在 E-R图中,用长方形表示实体,椭圆表示属性,
并用无向边把实体与其属性连接起来。形表示实体间
的联系,用无向边把菱形与有关实体连接起来并在无
向边旁标上联系的类型;若联系具有属性,则也把属
性与菱形用无向边相连。
例如,教师和课程之间关系的 E-R图如图 1-7所示。
第一章 数据库系统概论
教师
课程
讲授
n
m
课程号 课程名 学时 上课时间 教室
职务出生日期 调入日期 专业 电话性别姓名职工号
图 1-7 教师和课程关系的 E-R图
第一章 数据库系统概论
E-R图表示的概念模型既不涉及具体的数据模型, 又
是各种数据模型的基础 。 E-R方法是抽象和描述现实世
界的有力工具 。 图 1-8给出了学校教务管理的 E-R图 。
第一章 数据库系统概论
教师
课程
讲授
n
课程号 课程名 学时 上课时间 教室
职务
出生日期
调入日期
专业
电话
性别
姓名
职工号
管理
编排 学生
选修
管理

出生日期
入学日期
性别
姓名
学号
宿舍号
地点 主任电话系名系号
1
n
m
n
m
n
m
1
n
图 1-8 教务管理 E-R图
第一章 数据库系统概论
1.3.4 三种主要的数据模型
数据模型是数据库系统的核心和基础,不同的数据
库管理系统支持不同类型的数据模型。当前实际数据库
管理系统所支持的主要数据模型有:层次模型
(Hierarchical Model)、网状模型 (Network Model)和关系模
型 (Relational Model)。
1,基本层次联系
非关系模型的数据结构可以分解为基本层次联系 。
两个记录型及它们之间的一对多 (一对一 )的联系称为
基本层次联系, 如图 1-9所示 。 图中, R1称为父记录, R2
称为子记录 。
第一章 数据库系统概论
R
1
R
2
图 1-9 基本层次结构
第一章 数据库系统概论
2,层次模型
若一个基本层次联系的集合满足下列两条件, 则它
是层次模型:
① 有且仅有一个结点无父结点, 这样的结点称为根
结点 。
② 非根结点都有且仅有一个父结点 。
层次模型是一棵树 。 图 1-10是一个层次模型 。 在层
次模型中, 一个结点可以有几个子结点, 也可以没有
子结点 。 前一种情况下, 这几个子结点称为兄弟结点;
后一情况下, 该结点称为叶结点 。
第一章 数据库系统概论
R
R
2
R
1
R
3
R
4
图 1-10 一个层次模型
第一章 数据库系统概论
3,网状模型
若一个基本层次联系集合中, 至少有一个结点有一个
以上的父结点, 则这种数据模型是网状模型 。
网状模型还可能有的两个特点是:
① 可能有一个以上的结点, 无父结点 。
② 结点与其父结点之间的联系可能不止一个 。
图 1-11的 (a),(b),(c)给出的数据模型都是网状模型 。
第一章 数据库系统概论
R
1
R
2
( b )
R
1
R
3
R
2
( a )
R
2
R
4
( c )
R
1
R
3
图 1-11 网状模型
第一章 数据库系统概论
4,关系模型
关系模型是最迟出现的, 也是最重要的数据模型 。
当前广泛应用的数据库管理系统几乎都是支持关系模
型的, 被称为关系型数据库管理系统 (Relational Data
Base Management System),即 RDBMS。
在关系模型中, 用二维表表示实体及其相互联系 。
但对表的构成形式是有一定限制的 。 图 1-12的表是一
个关系模型 。
第一章 数据库系统概论
职工号 姓名 性别 部门 工资
1002
1004
1005
1010
胡一民
王爱民
张小花
宋文彬




技术科
车 间
设计所
技术科
75.00
128.35
112.27
86.94
图 1-12 一个关系模型:职工
第一章 数据库系统概论
关系模型对二维表的限制是:
① 表中每一列都必须是不可分的基本项 。 如图 1-13
的情况是不允许的 。
② 表中没有完全相同的两个元组 。
③ 在一个关系模式中, 不能有两个属性具有相同的
属性名 。
④ 在一个关系模式中, 属性间的顺序和元组间的顺
序都是无关紧要的 。
第一章 数据库系统概论
工资级别
工资
基本工资 补贴工资
… … …
图 1-13 不允许的表
第一章 数据库系统概论
1.4 数 据 库 系 统
1.4.1 数据库系统的三级模式结构
实际的数据库系统是多种多样的,但一般都具有
三级模式的结构特征。
数据库系统的三级模式结构是外模式、模式和内
模式,如图 1-14所示。
第一章 数据库系统概论
应用 1 应用 2 应用 3
外模式 A 外模式 B
模式
内模式
数据库
D BM S
OS
模式 / 内模式映像
外模式 / 模式映像
图 1-14 数据库系统的三级模式
第一章 数据库系统概论
1,模式
模式也称概念模式,是数据库中的数据在逻辑级
上的视图。
安全性主要指保密性。
完整性包括数据的正确性、有效性和相容性。
模式不是数据库本身,它仅仅描述数据库结构。
数据库管理系统提供模式描述语言 (模式 DDL)来
定义模式。
第一章 数据库系统概论
2,外模式
外模式也称子模式, 是个别用户的数据视图, 即个
别用户涉及到的数据库的局部逻辑结构 。
外模式是模式的子集 。 不同用户的外模式是不同的
(可互相覆盖 )。
一个应用程序只能启用一个外模式, 一个外模式可
被同一用户的若干应用程序使用 。
数据库管理系统提供外模式描述语言 (外模式 DDL)
描述外模式 。 用外模式 DDL给出的, 用以定义一个用
户数据视图的全部语句称为此用户的外模式 。
第一章 数据库系统概论
3,内模式
内模式也称存储模式 。 它既定义了数据库中全部数据
的物理结构, 还定义了数据的存储方法, 存取策略等 。
通常,用内模式描述语言 (内模式 DDL)来描述和定义
内模式。
4,二级映像
在模式与内模式之间通过模式 /内模式映像进行转换。
当数据库的存储结构改变时,只要相应改变模式 /内模式
映像,可使模式保持不变。
第一章 数据库系统概论
5,数据库管理系统 (DBMS)
DBMS是数据库系统的关键内容。
DBMS的主要功能是:
(1) 数据库的定义、建立和维护功能。
(2) 数据存取功能 。
(3) 数据库运行管理功能。
第一章 数据库系统概论
1.4.2 用户访问数据库的过程
实际数据库系统的情况是互不相同的;实际数据库
系统所使用的术语也是有差别的 。 在理论讲述上, 各
种教材, 各篇文章所使用的术语名称也是不统一的,
这需要读者在使用时进行比较理解 。
为使读者对数据库系统的工作有一个整体概念, 我
们介绍一下访问数据库数据的主要步骤, 该过程如图
1-15所示 。
第一章 数据库系统概论
应用程序 A
工作区
模式
系统缓冲区
数据库
D B MS
OS
内模式工作日志
应用系统 A
工作区
图 1-15 访问数据库的主要步骤
第一章 数据库系统概论
1.4.3 数据库系统的主要特征
在数据库系统中,由 DBMS集中统一管理整个组
织的全部数据,统一管理和控制数据库系统的运行。
1,数据的结构化
2,数据冗余度小
3,数据共享
4,具有较高的数据和程序独立性
5,提供各种安全性功能