第 1章 数据库系统概述
教材:数据库技术及应用 2006年 4月
宁可、吴菁、胡海编著
本章要点
? 数据库技术的基本概念
? 数据库技术的发展
? 数据库系统的结构
? 数据库系统的组成
? 概念模型
? 数据模型
? 数据库安全性
目 录
1.1 数据库技术的基本概念
1.2 数据库技术的发展
1.2.1 人工管理
1.2.2 文件管理
1.2.3 数据库技术
1.3 数据库系统的 结构
1.3.1 数据模式
1.3.2 三级模式结构
1.3.3 数据库系统的二级映像技术及作用
1.4 数据库系统的组成
1.5 概念模型
1.5.1 信息的三种世界
1.5.2 概念模型及其表示
1.6 数据模型
1.6.1 数据模型的概述
1.6.2 层次模型和网状模型
1.6.3 关系模型
目 录
1.7 数据库的安全性
1.7.1 安全性控制的一般方法
1.7.2 数据完整性控制
1.7.3 并发控制
小结
习题
1.1 数据库技术的基本概念
? 数据与信息,数据就是对客观事物描述和记录的符号,
数据涉及的种类很多,不仅包括文字符号,还包括图
形、图像、声音等多媒体数据,它所包含的含义就是
信息。
? 数据处理就是对数据的加工整理
? 数据库( DataBase,简称 DB),就是存储数据的仓库,
是长期存储在计算机内有结构的大量的共享的数据集
合。
? 数据库管理系统( DataBase Management System,简
称 DBMS),是为数据库的建立、使用和维护而配置的
软件,它负责对数据库进行统一的管理和控制。
1.2 数据库技术的发展
由于实际的需要, 以及硬件技术的进步, 数据处理
技术得到了快速发展 。 计算机数据处理经历了如下三个
阶段,
? 人工管理:数据不保存, 在需要时输入数据
? 文件管理:据以文件的形式长久保存, 二是由文
件系统管理数据, 文件系统把数据组织成相互独立的数
据文件, 按文件名访问数据,
? 数据库技术:在文件系统上发展起来的技术, 它克
服了文件系统的弱点, 为用户提供了一种使用方便, 功
能强大的数据管理手段 。
1.3 数据库系统的 结构
可以从不同的角度分析数据库系统的结构 。
从数据库管理系统的角度来看数据库, 这是数据
库系统内部的系统结构, 通常称为数据库体系结
构 。 从数据库最终用户角度来看, 这是数据库系
统外部的体系结构 。
1,数据模式
数据模式是对数据库中的全体数据的逻辑结构, 联系和约束的描述 。 它仅
仅涉及到数据的结构和属性的说明, 而不涉及到具体的值 。 虽然数据库管理
系统有很多种, 数据的存储结构也各不相同, 但在体系结构上都有相同的特
征, 即采用三级模式结构 。
2,三级模式结构
为了解决复杂的问题, 往往采用分层的方法进行处理 。 与此类似, 数据库
系统的内部体系结构分成 3级 ( 层 ),外模式, 模式和内模式三级构成 。 如
图,
数据库
内模式
模式
外模式 1 外模式 2 外模式 3
应用 A 应用 B 应用 C 应用 D 应用 E
模式 / 内模式映像
模式 / 内模式映像
3,数据库系统的二级映像技术及作用
数据库系统的三级模式是对数据的三个抽象级别, 它把数据的具
体管理交给 DBMS管理, 使用户能逻辑上地处理数据, 而不必关心数
据在计算机中的具体表示方式, 存储位置, 存取方式 。 不同的人员工
作在不同的模式上 。 为了能够在内部实现这三个抽象层次的联系和转
换, 数据库管理系统在这三级模式之间提供了两层映像,
? 外模式 /模式映像
? 模式 /内模式
正是这两层映像技术保证了数据库系统中的数据具有较高的独立
性 。 当数据库的物理结构发生变化时, 如存储设备的改变, 数据存储
位置或存储组织方式的改变, 则数据库管理员对模式 /内模式映像作相
应改变, 可以使逻辑模式保持不变, 用户仍可按原来的逻辑模式使用
数据 。 例如, 为了提高数据的存取效率, 数据库管理员可以对数据库
的物理组织进行一定形式和程度的改变, 而数据库的逻辑结构不变,
不需要重新定义逻辑模式, 也不需要修改应用程序, 从而保证了数据
的物理独立性 。
1.4 数据库系统的组成
数据库系统由以下三部分组成,
? 硬件
? 软件
? 人员
应用系统
数据库管理系统
操作系统
硬件
1.5 概念模型
计算机不能直接处理现实世界中的客观事物,而数据库系统正是使
用计算机技术对客观事物进行管理,因此就需要对客观事物进行抽象、
进行模拟,以建立适合于数据库系统进行管理的数据模型。
数据模型是对现实世界数据特征的模拟和抽象。数据模型应满足三
个方面的要求:一是比较真实地模拟现实世界;二是容易为人所理解;
三是便于计算机处理。由于问题的复杂性,一种模型很难同时满足这些
要求,为了使问题得以简化,在数据库系统中针对不同的使用对象和目
的,采用两种数据模型:概念模型和数据模型。实际上,就是把抽象和
模拟现实世界的过程分为两个阶段,概念模型和数据模型是两个不同阶
段所使用的工具。
1,信息的现实世界
现实世界泛指客观世界 。 信息的现实世界是指我们要管理的客观存
在的各种事物, 事物之间的相互联系及事物的发生, 变化过程 。 通过对
现实世界的了解和认识, 我们对要管理的对象形成概念模型 。
2,信息世界
当事物用信息来描述时, 即进入了信息世界 。 在信息世界中, 实体
的特征在头脑中形成的知识称为属性 。 信息世界通过实体, 特征, 实体
集及联系来描述 。 信息世界所涉及的概念主要有,
实体:客观存在并可互相区分的事物
属性:实体所具有的某一方面特征的抽象描述
实体集:同一类型实体的集合
码:它是能够唯一标识一个实体的属性集
联系:在现实世界中, 事物之间是有联系的, 这些联系在信息世界中反
映为实体之间的联系
1.5.1 信息的三种世界
3,信息的计算机世界
信息世界中的信息, 经过数字化处理形成计算机
能够处理的数据, 就进入了计算机世界 。
4,信息的三个世界之间的联系
现实世界, 信息世界和计算机世界是由客观事物
到认识, 由认识到使用管理的三个不同层次 。 现实世
界的的客观事物及联系通过系统分析形成信息世界的
概念模型, 而概念模型经过信息化处理转换为计算机
世界的数据模型 。
概念模型是对信息世界的管理对象, 属性及联系等信息的描
述形式 。
概念模型是对信息世界的建模, 它应当能够全面, 准确地表
示出信息世界中的基本概念 。 概念模型的表示方法很多, 其中最
为著名使用最广泛的是 P.P.S,Chen 1976年提出的实体 -联系方
法 ( Entity-Relationship Approach,即 E-R图法 ), 该方法用
E-R图来描述现实世界的概念模型, E-R方法也称 E-R模型 。 E-R图
法提供了表示实体集, 属性和联系的方法, 在 E-R图中,
? 实体集名:用矩形表示, 矩形框内写明实体名 。
? 属性:用椭圆形表示, 并用线段将其与相应的实体连接
起来 。
1.5.2 概念模型及其表示方法
1.6 数据模型
数据模型是严格定义的一组概念的集合 。 这些
概念精确地描述了系统的静态特性, 动态特性和完整
性约束条件 。
1.6.1 数据模型 的概述
数据模型通常由数据结构, 数据操作和完整性约束三部分组成 。
(1) 数据结构
数据结构是所研究的对象类型的集合, 这些对象是数据库的组成成分, 例如层
次或网状模型的数据项和记录, 关系模型中的关系和属性 。
数据结构是刻画一个数据模型性质最重要的方面 。 因此在数据库系统中, 通常
按照数据结构的类型来命名数据模型 。 例如层次结构, 网状结构和关系结构的
数据模型分别命名为层次模型, 网状模型和关系模型 。
(2) 数据操作
数据操作是指对数据库中各种数据对象允许执行的操作的集合 。 数据操作
包括操作对象和有关的操作规则 。 数据库中的数据操作主要有数据检索和数据
更新 ( 即插入, 删除, 修改 ) 两大类操作 。
(3) 数据约束条件
数据约束条件是一组数据完整性规则的集合 。 数据完整性规则是指数据模型
中的数据及其联系所具有的制约及依存规则, 用以限定符合数据模型的数据库
状态以及状态的变化, 以保证数据的正确, 有效和相容 。
常见的数据模型有层次模型, 网状模型和关系模型三种 。 现在所普遍使用
的是关系模型 。
1.6.2 层次模型 和网状模型
用树形结构来表示实体以及实体之间联系的模型
叫层次模型 。 现实世界中的许多实体之间本来就呈现
出层次关系 。
现实世界中, 许多事物之间是非层次结构的, 用
层次模型表示有一定困难, 网状模型克服了这一缺点 。
网状模型取消了层次模型中的限制 。
层次模型的优点是:数据模型结构简单, 缺点是
不适宜表示非层次的联系 。 网状模型的优点是:能够
更直接地描述现实世界, 存取效率较高, 缺点是结构
复杂, 不容易使用 。
由于层次模型和网状模型的固有缺点, 已逐渐被
关系模型所取代 。
1.7 数据库的安全性
数据库系统中的数据是由 DBMS统一管理和控制的, 为了适应
数据共享的环境, DBMS必须提供数据的安全性, 完整性, 并发控
制和数据库恢复等数据保护能力, 以保证数据库中数据的安全可
靠和正确有效 。 在计算机系统中, 安全措施一般是一级一级层层
设置的, 例如, 下图就是一种很常用的安全模型 。
用户 DBMS 操作系

DB
用户标识和
鉴别
存储控制 操作系统安
全保护
密码存

1.7.1 安全性控制的一般方法
1,用户标识和鉴定
用户标识和鉴定是系统提供的最外层安全保护措施 。 其方法是
由系统提供一定的方式让用户标识自己的名字或身份 。 系统内部记
录着所有合法用户的标识, 每次用户要求进入系统时, 由系统将用
户提供的身份标识与系统内部记录的合法用户标识进行核对, 通过
鉴定后才提供机器使用权 。
2,存取控制
在数据库系统中, 为了保证用户只能访问他有权存取的数据,
必须预先对每个用户定义存取权限 。 对于通过鉴定获得上机权的用
户 ( 即合法用户 ), 系统根据它的存取权限定义, 对它的各种操作
请求进行控制, 确保它只执行合法操作 。
1.7.1 安全性控制的一般方法
3,视图
通过视图机制把要保密的数据对无权存取这些数据的用户隐藏起来,
从而自动地对数据提供一定程度的安全保护 。 在实际应用中通常是视图机
制与授权机制配合使用, 首先用视图机制屏蔽掉一部分保密数据, 然后在
视图上面再进 — 步定义存取权限 。
4,审计
当数据相当敏感, 或者对数据的处理极为重要时, 就必须以审计技术
作为预防手段, 监测可能的不合法行为 。 审计追踪使用的是一个专用文件
或数据库, 它自动保存用户对数据库的所有操作记录, 利用审计追踪的信
息, 就能重现导致数据库现有状况的一系列事件, 以找到存取数据的人 。
5,加密
对于高度敏感性数据, 还可以采用数据加密技术, 以密码形式存储和
传输数据 。 这样企图通过不正常渠道获取数据, 例如, 利用系统安全措施
的漏洞非法访问数据, 或者在通信线路上窃取数据, 那么只能看到一些无
法辨认的二进制代码 。
1.7.2 数据完整性控制
数据库的完整性是指数据的正确性和相容性 。 例如,
学生的年龄必须是整数, 取值范围为 14— 29;学生的性
别只能是男或女;学生的学号一定是唯一的,学生所在
的系必须是学校开设的系等 。 数据的完整性与安全性是
数据库保护的两个不同方面 。 安全性是防止用户非法使
用数据库, 包括恶意破坏数据和越权存取数据 。 完整性
则是防止合法用户使用数据库时向数据库加入不合语义
的数据 。
1.7.3 并发控制
数据库是一个共享资源, 可以供多个用户使用 。 这
些用户程序可以串行执行, 每个时刻只有一个用户程序
运行, 执行对数据库的存取, 其他用户程序必须等到这
个用户程序结束以后方能对数据库存取, 这会造成系统
资源的大量浪费 。 因此, 为了充分利用数据库资源, 发
挥数据库共享资源的特点, 应该允许多个用户并行地存
取数据库 。 但这样就会产生多个用户程序并发存取同一
数据的情况, 若对并发操作不加控制就可能会存取和存
储不正确的数据, 破坏数据库的一致性 。 所以数据库管
理系统必须提供并发控制机制 。
小结
本章主要介绍了数据管理技术的发展过程, 数据
库系统的基本概念:数据库, 数据库管理系统, 数据
库系统 。 数据模型:层次模型, 网状模型, 关系模型 。
数据模式:子模式, 概念模式和物理模式 。 数据库系
统的三级模式结构及两级映像的体系结构, 它保证了
数据库系统中的数据具有较高的逻辑独立性和物理独
立性 。
习题
1,什么是数据, 信息和数据处理? 它们之间有什么关系?
2,什么是数据库, 数据库管理系统和数据库系统?
3,简述数据管理技术发展经历的三个阶段 。
4,简述数据库系统的三级模式结构及每级模式的作用 。
5,什么是数据的独立性 。
6,简述数据库系统中的二级映像技术及作用 。
7,解释概念模型中的术语:实体, 属性, 域, 实体集, 码, 实体关系图 。
8,试述概念模型的作用 。
9,请举出现实世界中存在的两个实体集之间的 1,1,1,n; m,n关系的实例 。
10,学校中有若干系, 每个系有若干班级和教研室, 每个教研室有若干教师, 每个教师教
若干门课程 。 每个班有若干个学生, 每个学生选修若干门课程, 每门课程有若干个学生
选修 。 用 E-R图画出该学校的概念模型 。