An Introduction to Database System
中国人民大学信息学院计算机系
数据库系统概论
An Introduction to Database System
第六章 数据库设计 (续 -1)
An Introduction to Database System
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
An Introduction to Database System
6.3.1 概念结构
? 什么是概念结构设计
? 需求分析阶段描述的用户应用需求是现实世
界的具体需求
? 将需求分析得到的用户需求抽象为信息结构
即概念模型的过程就是概念结构设计
? 概念结构是各种数据模型的共同基础,它比
数据模型更独立于机器、更抽象,从而更加
稳定。
? 概念结构设计是整个数据库设计的关键
An Introduction to Database System
概念结构(续)
现实世界
机器世界
信息世界
需求分析
概念结构设计
An Introduction to Database System
概念结构(续)
? 概念结构设计的特点
( 1)能真实、充分地反映现实世界,包括事物
和事物之间的联系,能满足用户对数据的处理
要求。是对现实世界的一个真实模型。
( 2)易于理解,从而可以用它和不熟悉计算机
的用户交换意见,用户的积极参与是数据库的
设计成功的关键。
An Introduction to Database System
概念结构(续)
? 概念结构设计的特点 (续 )
( 3)易于更改,当应用环境和应用要求改变时,
容易对概念模型修改和扩充。
( 4)易于向关系、网状、层次等各种数据模型
转换。
An Introduction to Database System
概念结构(续)
? 描述概念模型的工具
? E-R模型
An Introduction to Database System
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
An Introduction to Database System
6.3.2 概念结构设计的方法与步骤
? 设计概念结构的四类方法
? 自顶向下
? 首先定义全局概念结构的框架,然后逐
步细化
? 自底向上
? 首先定义各局部应用的概念结构,然后
将它们集成起来,得到全局概念结构
An Introduction to Database System
概念结构设计的方法与步骤(续)
? 逐步扩张
? 首先定义最重要的核心概念结构,然后
向外扩充,以滚雪球的方式逐步生成其他
概念结构,直至总体概念结构
? 混合策略
? 将自顶向下和自底向上相结合,用自顶
向下策略设计一个全局概念结构的框架,
以它为骨架集成由自底向上策略中设计的
各局部概念结构。
An Introduction to Database System
概念结构设计的方法与步骤(续)
自顶向下策略
An Introduction to Database System
概念结构设计的方法与步骤(续)
自底向上策略
An Introduction to Database System
概念结构设计的方法与步骤(续)
逐步扩张
An Introduction to Database System
概念结构设计的方法与步骤(续)
? 常用策略( P215图 6.8)
? 自顶向下地进行需求分析
? 自底向上地设计概念结构
? 自底向上设计概念结构的步骤
( P216图 6.9)
? 第 1步:抽象数据并设计局部视图
? 第 2步:集成局部视图,得到全局概念结构
An Introduction to Database System
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
An Introduction to Database System
6.3.3 数据抽象与局部视图设计
? 数据抽象
? 局部视图设计
An Introduction to Database System
一、数据抽象
? 概念结构是对现实世界的一种抽象
? 从实际的人、物、事和概念中抽取所关心的
共同特性,忽略非本质的细节
? 把这些特性用各种概念精确地加以描述
? 这些概念组成了某种模型
An Introduction to Database System
数据抽象(续)
? 三种常用抽象
1,分类( Classification)
? 定义某一类概念作为现实世界中一组对象的
类型
? 这些对象具有某些共同的特性和行为
? 它抽象了对象 值和型 之间的, is member of”
的语义
? 在 E-R模型中,实体型就是这种抽象
例,P216图 6.10
An Introduction to Database System
数据抽象(续)
2,聚集( Aggregation)
? 定义某一类型的组成成分
? 它抽象了对象内部类型和成分之间, is part
of”的语义
? 在 E-R模型中若干属性的聚集组成了实体型,
就是这种抽象
例,P217图 6.11,图 6.12
An Introduction to Database System
数据抽象(续)
3,概括( Generalization)
? 定义类型之间的一种子集联系
? 它抽象了类型之间的, is subset of”的语义
? 概括有一个很重要的性质:继承性。子类继
承超类上定义的所有抽象。
例,P217图 6.13
An Introduction to Database System
数据抽象(续)
注:原 E-R模型不具有概括,本书对 E-R模型作了
扩充,允许定义超类实体型和子类实体型。
? 用双竖边的矩形框表示子类,
? 用直线加小圆圈表示超类 -子类的联系
An Introduction to Database System
数据抽象(续)
? 数据抽象的用途
? 对需求分析阶段收集到的数据进行分类、组
织(聚集),形成
? 实体
? 实体的属性,标识实体的码
? 确定实体之间的联系类型 (1:1,1:n,m:n)
An Introduction to Database System
二、局部视图设计
设计分 E-R图的步骤,
⒈ 选择局部应用
⒉逐一设计分 E-R图
An Introduction to Database System
⒈ 选择局部应用
? 需求分析阶段,已用多层数据流图和数据字典
描述了整个系统。
? 设计分 E-R图首先需要根据系统的具体情况,
在多层的数据流图中 选择 一个 适当层次的数据
流图,让这组图中每一部分对应一个局部应用,
然后以这一层次的数据流图为出发点,设计分
E-R图。
An Introduction to Database System
选择局部应用(续)
? 通常以中层数据流图作为设计分 E-R
图的依据。原因,
? 高层数据流图只能反映系统的概貌
? 中层数据流图能较好地反映系统中各局部应
用的子系统组成
? 低层数据流图过细
An Introduction to Database System
选择局部应用(续)
例:由于学籍管理、课程管理等都不太复
杂,因此可以它们入手设计学生管理子
系统的分 E-R图。如果局部应用比较复杂,
则可以从更下层的数据流图入手。
An Introduction to Database System
⒉ 逐一设计分 E-R图
? 任务
? 标定局部应用中的实体、属性、码,实体间
的联系
? 将各局部应用涉及的数据分别从数据字典
中抽取出来,参照数据流图,标定各局部
应用中的实体、实体的属性、标识实体的
码,确定实体之间的联系及其类型( 1:1,
1:n,m:n)
An Introduction to Database System
逐一设计分 E-R图(续)
? 如何抽象实体和属性
? 实体,现实世界中一组具有某些共同特性和
行为的对象就可以抽象为一个实体。对象和
实体之间是, is member of"的关系。
例:在学校环境中,可把张三、李四等对象抽
象为学生实体。
An Introduction to Database System
逐一设计分 E-R图(续)
? 属性,对象类型的组成成分可以抽象为实体
的属性。组成成分与对象类型之间是, is
part of"的关系。
例:学号、姓名、专业、年级等可以抽象为学
生实体的属性。其中学号为标识学生实体的码。
An Introduction to Database System
逐一设计分 E-R图(续)
? 如何区分实体和属性
? 实体与属性是相对而言的 。同一事物,在一
种应用环境中作为, 属性,,在另一种应用
环境中就必须作为, 实体, 。
例:学校中的系,在某种应用环境中,它只
是作为, 学生, 实体的一个属性,表明一个
学生属于哪个系;而在另一种环境中,由于
需要考虑一个系的系主任、教师人数、学生
人数、办公地点等,这时它就需要作为实体
了。
An Introduction to Database System
逐一设计分 E-R图(续)
? 一般原则
? 属性不能再具有需要描述的性质。即属性
必须是不可分的数据项,不能再由另一些
属性组成。
? 属性不能与其他实体具有联系。联系只发
生在实体之间。
? 符合上述两条特性的事物一般作为属性对待。
? 为了简化 E-R图的处置,现实世界中的事物
凡能够作为属性对待的,应尽量作为属性。
An Introduction to Database System
逐一设计分 E-R图(续)
? 举例
例 1:, 学生, 由学号、姓名等属性进一步描
述,根据准则1,,学生, 只能作为实体,
不能作为属性。
例 2:职称通常作为教师实体的属性,但在涉
及住房分配时,由于分房与职称有关,也就
是说职称与住房实体之间有联系,根据准则
2,这时把职称作为实体来处理会更合适些。
(教程P 194图 6-10)
An Introduction to Database System
逐一设计分 E-R图(续)
? 设计分 E-R图的步骤
? ( 1)以数据字典为出发点定义 E-R图。
? 数据字典中的, 数据结构,,, 数据流,
和, 数据存储, 等已是若干属性的有意义
的聚合
? ( 2)按上面给出的准则进行必要的调整。
An Introduction to Database System
逐一设计分 E-R图(续)
例:学籍管理局部应用中主要涉及的实体包括学
生、宿舍、档案材料、班级、班主任。
实体之间的联系,
? 由于一个宿舍可以住多个学生,而一个学生
只能住在某一个宿舍中,因此宿舍与学生之
间是 1:n的联系。
? 由于一个班级往往有若干名学生,而一个学
生只能属于一个班级,因此班级与学生之间
也是 1:n的联系 。
An Introduction to Database System
逐一设计分 E-R图(续)
? 由于班主任同时还要教课,因此班主任与学
生之间存在指导联系,一个班主任要教多名
学生,而一个学生只对应一个班主任,因此
班主任与学生之间也是 1:n的联系。
? 而学生和他自己的档案材料之间,班级与班
主任之间都是 1:1的联系。
学籍管理局部应用的分 E-R图草图:教程P
195图 6- 11
An Introduction to Database System
逐一设计分 E-R图(续)
接下来需要进一步斟酌该 E-R图,做适当调整。
? (1) 在一般情况下,性别通常作为学生实体
的属性,但在本局部应用中,由于宿舍分配
与学生性别有关,根据准则2,应该把性别
作为实体对待。
? (2) 数据存储, 学生登记表,,由于是手工
填写,供存档使用,其中有用的部分已转入
学生档案材料中,因此这里就不必作为实体
了。
最后得到学籍管理局部应用的分 E-R图:教程
P 195如图 6-12。
An Introduction to Database System
逐一设计分 E-R图(续)
该 E-R图中省略了各个实体的属性描述,
学生:{ 学号,姓名,出生日期}
性别:{ 性别 }
档案材料:{ 档案号, …… }
班级:{ 班级号,学生人数}
班主任:{ 职工号,姓名,性别,
是否为优秀班主任}
宿舍:{ 宿舍编号,地址,人数}
其中有下划线的属性为实体的码。
An Introduction to Database System
逐一设计分 E-R图(续)
同样方法可以得到课程管理局部应用的分 E-R图,
(图 6-13)
各实体的属性分别为,
学生:{姓名,学号,性别,年龄,所在系,
年级,平均成绩}
课程:{ 课程号,课程名,学分}
教师:{ 职工号,姓名,性别,职称}
教科书:{ 书号,书名,价钱}
教室:{ 教室编号,地址,容量}
An Introduction to Database System
6.3 概念结构设计
6.3.1 概念结构
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
An Introduction to Database System
6.3.4 视图的集成
? 各个局部视图即分 E-R图建立好后,还需
要对它们进行合并,集成为一个整体的
数据概念结构即总 E-R图。
An Introduction to Database System
视图的集成(续)
? 视图集成的两种方式
? 一次集成( P224图 6.25(a))
? 一次集成多个分 E-R图
? 通常用于局部视图比较简单时
? 逐步累积式( P224图 6.25(b))
? 首先集成两个局部视图(通常是比较关键
的两个局部视图)
? 以后每次将一个新的局部视图集成进来
An Introduction to Database System
视图的集成(续)
? 集成局部 E-R图的步骤
1,合并
2,修改与重构
An Introduction to Database System
视图的集成(续)
An Introduction to Database System
一、合并分 E-R图,生成初步 E-R图
? 各分E-R图存在冲突
? 各个局部应用所面向的问题不同
由不同的设计人员进行设计
各个分 E-R图之间必定会存在许多不一致的
地方
? 合并分 E-R图的主要工作与关键所在:合理
消除各分 E-R图的冲突
An Introduction to Database System
合并分 E-R图,生成初步 E-R图(续)
? 冲突的种类
? 属性冲突
? 命名冲突
? 结构冲突
An Introduction to Database System
⒈ 属性冲突
? 两类属性冲突
? 属性域冲突,属性值的类型、取值范围或取
值集合不同。
例 1,由于学号是数字,因此某些部门(即局
部应用)将学号定义为整数形式,而由于学号
不用参与运算,因此另一些部门(即局部应用)
将学号定义为字符型形式。
例 2,某些部门(即局部应用)以出生日期形
式表示学生的年龄,而另一些部门(即局部应
用)用整数形式表示学生的年龄。
An Introduction to Database System
属性冲突(续)
? 属性取值单位冲突 。
例:学生的身高,有的以米为单位,有的以厘
米为单位,有的以尺为单位。
An Introduction to Database System
属性冲突(续)
? 属性冲突的解决方法
? 通常用讨论、协商等行政手段加以解决
An Introduction to Database System
⒉ 命名冲突
? 两类命名冲突
? 同名异义,不同意义的对象在不同的局部应
用中具有相同的名字
例,局部应用 A中将教室称为房间
局部应用 B中将学生宿舍称为房间
? 异名同义(一义多名),同一意义的对象在
不同的局部应用中具有不同的名字
例,有的部门把教科书称为课本
有的部门则把教科书称为教材
An Introduction to Database System
命名冲突(续)
? 命名冲突可能发生在属性级、实体级、
联系级上。其中属性的命名冲突更为常
见。
? 命名冲突的解决方法
? 通过讨论、协商等行政手段加以解决
An Introduction to Database System
⒊ 结构冲突
? 三类结构冲突
? 同一对象在不同应用中具有不同的抽象
例,,课程, 在某一局部应用中被当作实体
在另一局部应用中则被当作属性
? 解决方法:通常是把属性变换为实体或把
实体变换为属性,使同一对象具有相同的
抽象。变换时要遵循两个准则。
An Introduction to Database System
结构冲突(续)
? 同一实体在不同局部视图中所包含的属性不
完全相同,或者属性的排列次序不完全相同 。
? 产生原因:不同的局部应用关心的是该实
体的不同侧面。
? 解决方法:使该实体的属性取各分 E-R图
中属性的并集,再适当设计属性的次序 。
An Introduction to Database System
结构冲突(续)
学生
学号 姓名 性别 平均成绩
(a)在局部应用 A中
An Introduction to Database System
结构冲突(续)
学生
学号 姓名 出生日期 年级
(b)在局部应用 B中
所在系
An Introduction to Database System
结构冲突(续)
学生
学号 姓名 政治面貌
(c)在局部应用 C中
An Introduction to Database System
结构冲突(续)
学生
政治
面貌 学号
出生
日期 年级
(d)合并后
所在系 平均 成绩 姓名 性别
An Introduction to Database System
结构冲突(续)
? 实体之间的联系在不同局部视图中呈现不同
的类型
例 1,实体 E1与 E2在局部应用 A中是多对多
联系,而在局部应用 B中是一对多联系
例 2,在局部应用 X中 E1与 E2发生联系,而
在局部应用 Y中 E1,E2,E3三者之间有联系。
? 解决方法:根据应用语义对实体联系的类
型进行综合或调整。 (P226图 6.27)
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例
例:生成学校管理系统的初步 E-R图
以合并学籍管理局部视图,课程管理局部视图为
例
这两个分 E-R图存在着多方面的冲突,
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例
(1) 班主任实际上也属于教师,也就是说学籍管
理中的班主任实体与课程管理中的教师实体在
一定程度上属于异名同义,可以应将学籍管理
中的班主任实体与课程管理中的教师实体统一
称为教师,统一后教师实体的属性构成为,
教师:{ 职工号,姓名,性别,职称,
是否为优秀班主任}
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例(续)
(2) 将班主任改为教师后,教师与学生之间的联
系在两个局部视图中呈现两种不同的类型,一
种是学籍管理中教师与学生之间的指导联系,
一种是课程管理中教师与学生之间的教学联系,
由于指导联系实际上可以包含在教学联系之中,
因此可以将这两种联系综合为教学联系。
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例(续)
(3) 性别在两个局部应用中具有不同的抽象,它
在学籍管理中为实体,在课程管理中为属性,
按照前面提到的两个原则,在合并后的 E-R图
中性别只能作为实体,否则它无法与宿舍实体
发生联系。
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例(续)
(4) 在两个局部 E-R图中,学生实体属性组成及次
序都存在差异,应将所有属性综合,并重新调
整次序。假设调整结果为,
学生:{ 学号,姓名,出生日期,年龄,所在
系,年级,平均成绩}
解决上述冲突后,学籍管理分 E-R图与课程管
理分 E-R图合并为P 198图 6-16的形式。
An Introduction to Database System
二、修改与重构
? 基本任务
? 消除不必要的冗余,设计生成基本 E-R图
合并
初步 E-R图
分 E-R图
可能存在冗余的数据
和冗余的实体间联系
基本 E-R图
消除不必要的冗余
An Introduction to Database System
修改与重构(续)
1.冗余
2.消除冗余的方法
An Introduction to Database System
1.冗余
? 冗余的数据是指可由基本数据导出的数据,
冗余的联系是指可由其他联系导出的联系。
? 冗余数据和冗余联系容易破坏数据库的完整性,
给数据库维护增加困难
? 并不是所有的冗余数据与冗余联系都必须加以
消除,有时为了提高某些应用的效率,不得不
以冗余信息作为代价。
An Introduction to Database System
冗余(续)
? 设计数据库概念结构时,哪些冗余信息必须消
除,哪些冗余信息允许存在,需要根据用户的
整体需求来确定。
? 消除不必要的冗余后的初步 E-R图称为基本 E-R
图。
An Introduction to Database System
2.消除冗余的方法
? 分析方法
? 以数据字典和数据流图为依据,根据数据字
典中关于数据项之间逻辑关系的说明来消除
冗余。
An Introduction to Database System
消除冗余的方法 (续 )
例,教师工资单中包括该教师的基本工资、各
种补贴、应扣除的房租水电费以及实发工资。
由于实发工资可以由前面各项推算出来,因此
可以去掉,在需要查询实发工资时根据基本工
资、各种补贴、应扣除的房租水电费数据临时
生成。
An Introduction to Database System
消除冗余的方法(续)
? 如果是为了提高效率,人为地保留了一些冗
余数据,则应把数据字典中数据关联的说明
作为完整性约束条件。
? 一种更好的方法是把冗余数据定义在视图中
An Introduction to Database System
消除冗余的方法(续)
? 规范化理论
? 函数依赖的概念提供了消除冗余联系的形式
化工具
An Introduction to Database System
消除冗余的方法(续)
? 方法
1,确定分 E-R图实体之间的数据依赖 FL 。实体
之间一对一、一对多、多对多的联系可以用
实体码之间的函数依赖来表示。
例,
班级和学生之间一对多的联系,
学号 ?班级号
学生和课程之间多对多的联系,
(学号,课程号) ?成绩
An Introduction to Database System
消除冗余的方法(续)
2,求 FL的最小覆盖 GL,差集为
D = FL-GL。
逐一考察 D中的函数依赖,确定是否是冗余
的联系,若是,就把它去掉。
An Introduction to Database System
消除冗余的方法(续)
? 由于规范化理论受到泛关系假设的限制,应
注意下面两个问题,
1.冗余的联系一定在 D中,而 D中的联系不一
定是冗余的;
2.当实体之间存在多种联系时要将实体之间的
联系在形式上加以区分。
例 P229图 6.30中
部门和职工之间两种联系表示为,
负责人,职工号 ?部门号
部门号 ?负责人,职工号
An Introduction to Database System
泛关系假设
? 假设存在着一个单一的关系模式
, 假设已知一个模式 Sφ,它仅由单个关系
模式组成, 问题是要设计一个模式 SD,它与
Sφ‘等价 ’, 但在某些方面更好一些,
? 从一个关系模式出发, 而不是从一组关系模
式出发实行分解
?, 等价, 的定义也是一组关系模式与一个关
系模式的, 等价,
An Introduction to Database System
泛关系假设 (续 )
? 泛关系假设是运用规范化理论时的障碍
? 承认了泛关系假设, 就等于承认了现实世界
各实体间只能有一种联系
An Introduction to Database System
消除冗余,设计生成基本 E-R图实例
教程P 198图 6-16的初步 E-R图中存在着冗余数
据和冗余联系,
(1) 学生实体中的年龄属性可以由出生日期推
算出来,属于冗余数据,应该去掉。这样不仅
可以节省存储空间,而且当某个学生的出生日
期有误,进行修改后,无须相应修改年龄,减
少了产生数据不一致的机会。
学生:{ 学号,姓名,出生日期,所在系,
年级,平均成绩}
An Introduction to Database System
消除冗余,设计生成基本 E-R图实例(续)
(2) 教室实体与班级实体的上课联系可以由教室
与课程之间的开设联系、课程与学生之间的选
修联系、学生与班级之间的组成联系三者推导
出来,因此属于冗余联系,可以消去。
An Introduction to Database System
消除冗余,设计生成基本 E-R图实例(续)
(3) 学生实体中的平均成绩可以从选修联系中的
成绩属性中推算出来
? 由于应用中需要经常查询某个学生的平均成
绩,每次都进行这种计算效率就会太低,因
此为提高效率,保留该冗余数据
? 但定义一个触发器来保证学生的平均成绩等
于该学生各科成绩的平均值。
? 任何一科成绩修改后,或该学生学了新的科
目并有成绩后,就触发该触发器去修改该学
生的平均成绩属性值。
An Introduction to Database System
消除冗余,设计生成基本 E-R图实例(续)
教程P 200图 17是对图 16进行修改和重
构后生成的基本 E-R图。
学生管理子系统的基本 E-R图与教师管理
子系统以及后勤管理子系统的基本 E-R图
合并后,生成整个学校管理系统的基本
E-R图
An Introduction to Database System
三、验证整体概念结构
? 视图集成后形成一个整体的数据库概念结构,
对该整体概念结构还必须进行进一步验证,确
保它能够满足下列条件,
? 整体概念结构内部必须具有一致性,不存在
互相矛盾的表达。
? 整体概念结构能准确地反映原来的每个视图
结构,包括属性、实体及实体间的联系。
? 整体概念结构能满足需要分析阶段所确定的
所有要求。
An Introduction to Database System
验证整体概念结构(续)
? 整体概念结构最终还应该提交给用户,
征求用户和有关人员的意见,进行评审、
修改和优化,然后把它确定下来,作为
数据库的概念结构,作为进一步设计数
据库的依据 。
An Introduction to Database System
数据库设计
? 数据库的设计过程
? 需求分析
? 概念结构设计
? 逻辑结构设计
? 物理数据库设计
? 实施
? 运行维护
设计过程中往往还会有许多反复。
An Introduction to Database System
概念结构设计小结
? 什么是概念结构设计
现实世界
机器世界
信息世界
需求分析
概念结构设计
An Introduction to Database System
概念结构设计小结
? 概念结构设计的步骤
? 抽象数据并设计局部视图
? 集成局部视图,得到全局概念结构
? 验证整体概念结构
An Introduction to Database System
概念结构设计小结
? 数据抽象
? 分类
? 聚集
? 概括
An Introduction to Database System
概念结构设计小结
? 设计局部视图
? ⒈ 选择局部应用
? ⒉ 逐一设计分 E-R图
? 标定局部应用中的实体、属性、码,实体
间的联系
? 用 E-R图描述出来
An Introduction to Database System
概念结构设计小结
? 集成局部视图
? 1.合并分 E-R图,生成初步 E-R图
? 消除冲突
? 属性冲突
? 命名冲突
? 结构冲突
? 2,修改与重构
? 消除不必要的冗余,设计生成基本 E-R图
? 分析方法
? 规范化理论
An Introduction to Database System
下课了。。。
休息一会儿。。。
中国人民大学信息学院计算机系
数据库系统概论
An Introduction to Database System
第六章 数据库设计 (续 -1)
An Introduction to Database System
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
An Introduction to Database System
6.3.1 概念结构
? 什么是概念结构设计
? 需求分析阶段描述的用户应用需求是现实世
界的具体需求
? 将需求分析得到的用户需求抽象为信息结构
即概念模型的过程就是概念结构设计
? 概念结构是各种数据模型的共同基础,它比
数据模型更独立于机器、更抽象,从而更加
稳定。
? 概念结构设计是整个数据库设计的关键
An Introduction to Database System
概念结构(续)
现实世界
机器世界
信息世界
需求分析
概念结构设计
An Introduction to Database System
概念结构(续)
? 概念结构设计的特点
( 1)能真实、充分地反映现实世界,包括事物
和事物之间的联系,能满足用户对数据的处理
要求。是对现实世界的一个真实模型。
( 2)易于理解,从而可以用它和不熟悉计算机
的用户交换意见,用户的积极参与是数据库的
设计成功的关键。
An Introduction to Database System
概念结构(续)
? 概念结构设计的特点 (续 )
( 3)易于更改,当应用环境和应用要求改变时,
容易对概念模型修改和扩充。
( 4)易于向关系、网状、层次等各种数据模型
转换。
An Introduction to Database System
概念结构(续)
? 描述概念模型的工具
? E-R模型
An Introduction to Database System
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
An Introduction to Database System
6.3.2 概念结构设计的方法与步骤
? 设计概念结构的四类方法
? 自顶向下
? 首先定义全局概念结构的框架,然后逐
步细化
? 自底向上
? 首先定义各局部应用的概念结构,然后
将它们集成起来,得到全局概念结构
An Introduction to Database System
概念结构设计的方法与步骤(续)
? 逐步扩张
? 首先定义最重要的核心概念结构,然后
向外扩充,以滚雪球的方式逐步生成其他
概念结构,直至总体概念结构
? 混合策略
? 将自顶向下和自底向上相结合,用自顶
向下策略设计一个全局概念结构的框架,
以它为骨架集成由自底向上策略中设计的
各局部概念结构。
An Introduction to Database System
概念结构设计的方法与步骤(续)
自顶向下策略
An Introduction to Database System
概念结构设计的方法与步骤(续)
自底向上策略
An Introduction to Database System
概念结构设计的方法与步骤(续)
逐步扩张
An Introduction to Database System
概念结构设计的方法与步骤(续)
? 常用策略( P215图 6.8)
? 自顶向下地进行需求分析
? 自底向上地设计概念结构
? 自底向上设计概念结构的步骤
( P216图 6.9)
? 第 1步:抽象数据并设计局部视图
? 第 2步:集成局部视图,得到全局概念结构
An Introduction to Database System
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
An Introduction to Database System
6.3.3 数据抽象与局部视图设计
? 数据抽象
? 局部视图设计
An Introduction to Database System
一、数据抽象
? 概念结构是对现实世界的一种抽象
? 从实际的人、物、事和概念中抽取所关心的
共同特性,忽略非本质的细节
? 把这些特性用各种概念精确地加以描述
? 这些概念组成了某种模型
An Introduction to Database System
数据抽象(续)
? 三种常用抽象
1,分类( Classification)
? 定义某一类概念作为现实世界中一组对象的
类型
? 这些对象具有某些共同的特性和行为
? 它抽象了对象 值和型 之间的, is member of”
的语义
? 在 E-R模型中,实体型就是这种抽象
例,P216图 6.10
An Introduction to Database System
数据抽象(续)
2,聚集( Aggregation)
? 定义某一类型的组成成分
? 它抽象了对象内部类型和成分之间, is part
of”的语义
? 在 E-R模型中若干属性的聚集组成了实体型,
就是这种抽象
例,P217图 6.11,图 6.12
An Introduction to Database System
数据抽象(续)
3,概括( Generalization)
? 定义类型之间的一种子集联系
? 它抽象了类型之间的, is subset of”的语义
? 概括有一个很重要的性质:继承性。子类继
承超类上定义的所有抽象。
例,P217图 6.13
An Introduction to Database System
数据抽象(续)
注:原 E-R模型不具有概括,本书对 E-R模型作了
扩充,允许定义超类实体型和子类实体型。
? 用双竖边的矩形框表示子类,
? 用直线加小圆圈表示超类 -子类的联系
An Introduction to Database System
数据抽象(续)
? 数据抽象的用途
? 对需求分析阶段收集到的数据进行分类、组
织(聚集),形成
? 实体
? 实体的属性,标识实体的码
? 确定实体之间的联系类型 (1:1,1:n,m:n)
An Introduction to Database System
二、局部视图设计
设计分 E-R图的步骤,
⒈ 选择局部应用
⒉逐一设计分 E-R图
An Introduction to Database System
⒈ 选择局部应用
? 需求分析阶段,已用多层数据流图和数据字典
描述了整个系统。
? 设计分 E-R图首先需要根据系统的具体情况,
在多层的数据流图中 选择 一个 适当层次的数据
流图,让这组图中每一部分对应一个局部应用,
然后以这一层次的数据流图为出发点,设计分
E-R图。
An Introduction to Database System
选择局部应用(续)
? 通常以中层数据流图作为设计分 E-R
图的依据。原因,
? 高层数据流图只能反映系统的概貌
? 中层数据流图能较好地反映系统中各局部应
用的子系统组成
? 低层数据流图过细
An Introduction to Database System
选择局部应用(续)
例:由于学籍管理、课程管理等都不太复
杂,因此可以它们入手设计学生管理子
系统的分 E-R图。如果局部应用比较复杂,
则可以从更下层的数据流图入手。
An Introduction to Database System
⒉ 逐一设计分 E-R图
? 任务
? 标定局部应用中的实体、属性、码,实体间
的联系
? 将各局部应用涉及的数据分别从数据字典
中抽取出来,参照数据流图,标定各局部
应用中的实体、实体的属性、标识实体的
码,确定实体之间的联系及其类型( 1:1,
1:n,m:n)
An Introduction to Database System
逐一设计分 E-R图(续)
? 如何抽象实体和属性
? 实体,现实世界中一组具有某些共同特性和
行为的对象就可以抽象为一个实体。对象和
实体之间是, is member of"的关系。
例:在学校环境中,可把张三、李四等对象抽
象为学生实体。
An Introduction to Database System
逐一设计分 E-R图(续)
? 属性,对象类型的组成成分可以抽象为实体
的属性。组成成分与对象类型之间是, is
part of"的关系。
例:学号、姓名、专业、年级等可以抽象为学
生实体的属性。其中学号为标识学生实体的码。
An Introduction to Database System
逐一设计分 E-R图(续)
? 如何区分实体和属性
? 实体与属性是相对而言的 。同一事物,在一
种应用环境中作为, 属性,,在另一种应用
环境中就必须作为, 实体, 。
例:学校中的系,在某种应用环境中,它只
是作为, 学生, 实体的一个属性,表明一个
学生属于哪个系;而在另一种环境中,由于
需要考虑一个系的系主任、教师人数、学生
人数、办公地点等,这时它就需要作为实体
了。
An Introduction to Database System
逐一设计分 E-R图(续)
? 一般原则
? 属性不能再具有需要描述的性质。即属性
必须是不可分的数据项,不能再由另一些
属性组成。
? 属性不能与其他实体具有联系。联系只发
生在实体之间。
? 符合上述两条特性的事物一般作为属性对待。
? 为了简化 E-R图的处置,现实世界中的事物
凡能够作为属性对待的,应尽量作为属性。
An Introduction to Database System
逐一设计分 E-R图(续)
? 举例
例 1:, 学生, 由学号、姓名等属性进一步描
述,根据准则1,,学生, 只能作为实体,
不能作为属性。
例 2:职称通常作为教师实体的属性,但在涉
及住房分配时,由于分房与职称有关,也就
是说职称与住房实体之间有联系,根据准则
2,这时把职称作为实体来处理会更合适些。
(教程P 194图 6-10)
An Introduction to Database System
逐一设计分 E-R图(续)
? 设计分 E-R图的步骤
? ( 1)以数据字典为出发点定义 E-R图。
? 数据字典中的, 数据结构,,, 数据流,
和, 数据存储, 等已是若干属性的有意义
的聚合
? ( 2)按上面给出的准则进行必要的调整。
An Introduction to Database System
逐一设计分 E-R图(续)
例:学籍管理局部应用中主要涉及的实体包括学
生、宿舍、档案材料、班级、班主任。
实体之间的联系,
? 由于一个宿舍可以住多个学生,而一个学生
只能住在某一个宿舍中,因此宿舍与学生之
间是 1:n的联系。
? 由于一个班级往往有若干名学生,而一个学
生只能属于一个班级,因此班级与学生之间
也是 1:n的联系 。
An Introduction to Database System
逐一设计分 E-R图(续)
? 由于班主任同时还要教课,因此班主任与学
生之间存在指导联系,一个班主任要教多名
学生,而一个学生只对应一个班主任,因此
班主任与学生之间也是 1:n的联系。
? 而学生和他自己的档案材料之间,班级与班
主任之间都是 1:1的联系。
学籍管理局部应用的分 E-R图草图:教程P
195图 6- 11
An Introduction to Database System
逐一设计分 E-R图(续)
接下来需要进一步斟酌该 E-R图,做适当调整。
? (1) 在一般情况下,性别通常作为学生实体
的属性,但在本局部应用中,由于宿舍分配
与学生性别有关,根据准则2,应该把性别
作为实体对待。
? (2) 数据存储, 学生登记表,,由于是手工
填写,供存档使用,其中有用的部分已转入
学生档案材料中,因此这里就不必作为实体
了。
最后得到学籍管理局部应用的分 E-R图:教程
P 195如图 6-12。
An Introduction to Database System
逐一设计分 E-R图(续)
该 E-R图中省略了各个实体的属性描述,
学生:{ 学号,姓名,出生日期}
性别:{ 性别 }
档案材料:{ 档案号, …… }
班级:{ 班级号,学生人数}
班主任:{ 职工号,姓名,性别,
是否为优秀班主任}
宿舍:{ 宿舍编号,地址,人数}
其中有下划线的属性为实体的码。
An Introduction to Database System
逐一设计分 E-R图(续)
同样方法可以得到课程管理局部应用的分 E-R图,
(图 6-13)
各实体的属性分别为,
学生:{姓名,学号,性别,年龄,所在系,
年级,平均成绩}
课程:{ 课程号,课程名,学分}
教师:{ 职工号,姓名,性别,职称}
教科书:{ 书号,书名,价钱}
教室:{ 教室编号,地址,容量}
An Introduction to Database System
6.3 概念结构设计
6.3.1 概念结构
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
An Introduction to Database System
6.3.4 视图的集成
? 各个局部视图即分 E-R图建立好后,还需
要对它们进行合并,集成为一个整体的
数据概念结构即总 E-R图。
An Introduction to Database System
视图的集成(续)
? 视图集成的两种方式
? 一次集成( P224图 6.25(a))
? 一次集成多个分 E-R图
? 通常用于局部视图比较简单时
? 逐步累积式( P224图 6.25(b))
? 首先集成两个局部视图(通常是比较关键
的两个局部视图)
? 以后每次将一个新的局部视图集成进来
An Introduction to Database System
视图的集成(续)
? 集成局部 E-R图的步骤
1,合并
2,修改与重构
An Introduction to Database System
视图的集成(续)
An Introduction to Database System
一、合并分 E-R图,生成初步 E-R图
? 各分E-R图存在冲突
? 各个局部应用所面向的问题不同
由不同的设计人员进行设计
各个分 E-R图之间必定会存在许多不一致的
地方
? 合并分 E-R图的主要工作与关键所在:合理
消除各分 E-R图的冲突
An Introduction to Database System
合并分 E-R图,生成初步 E-R图(续)
? 冲突的种类
? 属性冲突
? 命名冲突
? 结构冲突
An Introduction to Database System
⒈ 属性冲突
? 两类属性冲突
? 属性域冲突,属性值的类型、取值范围或取
值集合不同。
例 1,由于学号是数字,因此某些部门(即局
部应用)将学号定义为整数形式,而由于学号
不用参与运算,因此另一些部门(即局部应用)
将学号定义为字符型形式。
例 2,某些部门(即局部应用)以出生日期形
式表示学生的年龄,而另一些部门(即局部应
用)用整数形式表示学生的年龄。
An Introduction to Database System
属性冲突(续)
? 属性取值单位冲突 。
例:学生的身高,有的以米为单位,有的以厘
米为单位,有的以尺为单位。
An Introduction to Database System
属性冲突(续)
? 属性冲突的解决方法
? 通常用讨论、协商等行政手段加以解决
An Introduction to Database System
⒉ 命名冲突
? 两类命名冲突
? 同名异义,不同意义的对象在不同的局部应
用中具有相同的名字
例,局部应用 A中将教室称为房间
局部应用 B中将学生宿舍称为房间
? 异名同义(一义多名),同一意义的对象在
不同的局部应用中具有不同的名字
例,有的部门把教科书称为课本
有的部门则把教科书称为教材
An Introduction to Database System
命名冲突(续)
? 命名冲突可能发生在属性级、实体级、
联系级上。其中属性的命名冲突更为常
见。
? 命名冲突的解决方法
? 通过讨论、协商等行政手段加以解决
An Introduction to Database System
⒊ 结构冲突
? 三类结构冲突
? 同一对象在不同应用中具有不同的抽象
例,,课程, 在某一局部应用中被当作实体
在另一局部应用中则被当作属性
? 解决方法:通常是把属性变换为实体或把
实体变换为属性,使同一对象具有相同的
抽象。变换时要遵循两个准则。
An Introduction to Database System
结构冲突(续)
? 同一实体在不同局部视图中所包含的属性不
完全相同,或者属性的排列次序不完全相同 。
? 产生原因:不同的局部应用关心的是该实
体的不同侧面。
? 解决方法:使该实体的属性取各分 E-R图
中属性的并集,再适当设计属性的次序 。
An Introduction to Database System
结构冲突(续)
学生
学号 姓名 性别 平均成绩
(a)在局部应用 A中
An Introduction to Database System
结构冲突(续)
学生
学号 姓名 出生日期 年级
(b)在局部应用 B中
所在系
An Introduction to Database System
结构冲突(续)
学生
学号 姓名 政治面貌
(c)在局部应用 C中
An Introduction to Database System
结构冲突(续)
学生
政治
面貌 学号
出生
日期 年级
(d)合并后
所在系 平均 成绩 姓名 性别
An Introduction to Database System
结构冲突(续)
? 实体之间的联系在不同局部视图中呈现不同
的类型
例 1,实体 E1与 E2在局部应用 A中是多对多
联系,而在局部应用 B中是一对多联系
例 2,在局部应用 X中 E1与 E2发生联系,而
在局部应用 Y中 E1,E2,E3三者之间有联系。
? 解决方法:根据应用语义对实体联系的类
型进行综合或调整。 (P226图 6.27)
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例
例:生成学校管理系统的初步 E-R图
以合并学籍管理局部视图,课程管理局部视图为
例
这两个分 E-R图存在着多方面的冲突,
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例
(1) 班主任实际上也属于教师,也就是说学籍管
理中的班主任实体与课程管理中的教师实体在
一定程度上属于异名同义,可以应将学籍管理
中的班主任实体与课程管理中的教师实体统一
称为教师,统一后教师实体的属性构成为,
教师:{ 职工号,姓名,性别,职称,
是否为优秀班主任}
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例(续)
(2) 将班主任改为教师后,教师与学生之间的联
系在两个局部视图中呈现两种不同的类型,一
种是学籍管理中教师与学生之间的指导联系,
一种是课程管理中教师与学生之间的教学联系,
由于指导联系实际上可以包含在教学联系之中,
因此可以将这两种联系综合为教学联系。
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例(续)
(3) 性别在两个局部应用中具有不同的抽象,它
在学籍管理中为实体,在课程管理中为属性,
按照前面提到的两个原则,在合并后的 E-R图
中性别只能作为实体,否则它无法与宿舍实体
发生联系。
An Introduction to Database System
合并分 E-R图,生成初步 E-R图实例(续)
(4) 在两个局部 E-R图中,学生实体属性组成及次
序都存在差异,应将所有属性综合,并重新调
整次序。假设调整结果为,
学生:{ 学号,姓名,出生日期,年龄,所在
系,年级,平均成绩}
解决上述冲突后,学籍管理分 E-R图与课程管
理分 E-R图合并为P 198图 6-16的形式。
An Introduction to Database System
二、修改与重构
? 基本任务
? 消除不必要的冗余,设计生成基本 E-R图
合并
初步 E-R图
分 E-R图
可能存在冗余的数据
和冗余的实体间联系
基本 E-R图
消除不必要的冗余
An Introduction to Database System
修改与重构(续)
1.冗余
2.消除冗余的方法
An Introduction to Database System
1.冗余
? 冗余的数据是指可由基本数据导出的数据,
冗余的联系是指可由其他联系导出的联系。
? 冗余数据和冗余联系容易破坏数据库的完整性,
给数据库维护增加困难
? 并不是所有的冗余数据与冗余联系都必须加以
消除,有时为了提高某些应用的效率,不得不
以冗余信息作为代价。
An Introduction to Database System
冗余(续)
? 设计数据库概念结构时,哪些冗余信息必须消
除,哪些冗余信息允许存在,需要根据用户的
整体需求来确定。
? 消除不必要的冗余后的初步 E-R图称为基本 E-R
图。
An Introduction to Database System
2.消除冗余的方法
? 分析方法
? 以数据字典和数据流图为依据,根据数据字
典中关于数据项之间逻辑关系的说明来消除
冗余。
An Introduction to Database System
消除冗余的方法 (续 )
例,教师工资单中包括该教师的基本工资、各
种补贴、应扣除的房租水电费以及实发工资。
由于实发工资可以由前面各项推算出来,因此
可以去掉,在需要查询实发工资时根据基本工
资、各种补贴、应扣除的房租水电费数据临时
生成。
An Introduction to Database System
消除冗余的方法(续)
? 如果是为了提高效率,人为地保留了一些冗
余数据,则应把数据字典中数据关联的说明
作为完整性约束条件。
? 一种更好的方法是把冗余数据定义在视图中
An Introduction to Database System
消除冗余的方法(续)
? 规范化理论
? 函数依赖的概念提供了消除冗余联系的形式
化工具
An Introduction to Database System
消除冗余的方法(续)
? 方法
1,确定分 E-R图实体之间的数据依赖 FL 。实体
之间一对一、一对多、多对多的联系可以用
实体码之间的函数依赖来表示。
例,
班级和学生之间一对多的联系,
学号 ?班级号
学生和课程之间多对多的联系,
(学号,课程号) ?成绩
An Introduction to Database System
消除冗余的方法(续)
2,求 FL的最小覆盖 GL,差集为
D = FL-GL。
逐一考察 D中的函数依赖,确定是否是冗余
的联系,若是,就把它去掉。
An Introduction to Database System
消除冗余的方法(续)
? 由于规范化理论受到泛关系假设的限制,应
注意下面两个问题,
1.冗余的联系一定在 D中,而 D中的联系不一
定是冗余的;
2.当实体之间存在多种联系时要将实体之间的
联系在形式上加以区分。
例 P229图 6.30中
部门和职工之间两种联系表示为,
负责人,职工号 ?部门号
部门号 ?负责人,职工号
An Introduction to Database System
泛关系假设
? 假设存在着一个单一的关系模式
, 假设已知一个模式 Sφ,它仅由单个关系
模式组成, 问题是要设计一个模式 SD,它与
Sφ‘等价 ’, 但在某些方面更好一些,
? 从一个关系模式出发, 而不是从一组关系模
式出发实行分解
?, 等价, 的定义也是一组关系模式与一个关
系模式的, 等价,
An Introduction to Database System
泛关系假设 (续 )
? 泛关系假设是运用规范化理论时的障碍
? 承认了泛关系假设, 就等于承认了现实世界
各实体间只能有一种联系
An Introduction to Database System
消除冗余,设计生成基本 E-R图实例
教程P 198图 6-16的初步 E-R图中存在着冗余数
据和冗余联系,
(1) 学生实体中的年龄属性可以由出生日期推
算出来,属于冗余数据,应该去掉。这样不仅
可以节省存储空间,而且当某个学生的出生日
期有误,进行修改后,无须相应修改年龄,减
少了产生数据不一致的机会。
学生:{ 学号,姓名,出生日期,所在系,
年级,平均成绩}
An Introduction to Database System
消除冗余,设计生成基本 E-R图实例(续)
(2) 教室实体与班级实体的上课联系可以由教室
与课程之间的开设联系、课程与学生之间的选
修联系、学生与班级之间的组成联系三者推导
出来,因此属于冗余联系,可以消去。
An Introduction to Database System
消除冗余,设计生成基本 E-R图实例(续)
(3) 学生实体中的平均成绩可以从选修联系中的
成绩属性中推算出来
? 由于应用中需要经常查询某个学生的平均成
绩,每次都进行这种计算效率就会太低,因
此为提高效率,保留该冗余数据
? 但定义一个触发器来保证学生的平均成绩等
于该学生各科成绩的平均值。
? 任何一科成绩修改后,或该学生学了新的科
目并有成绩后,就触发该触发器去修改该学
生的平均成绩属性值。
An Introduction to Database System
消除冗余,设计生成基本 E-R图实例(续)
教程P 200图 17是对图 16进行修改和重
构后生成的基本 E-R图。
学生管理子系统的基本 E-R图与教师管理
子系统以及后勤管理子系统的基本 E-R图
合并后,生成整个学校管理系统的基本
E-R图
An Introduction to Database System
三、验证整体概念结构
? 视图集成后形成一个整体的数据库概念结构,
对该整体概念结构还必须进行进一步验证,确
保它能够满足下列条件,
? 整体概念结构内部必须具有一致性,不存在
互相矛盾的表达。
? 整体概念结构能准确地反映原来的每个视图
结构,包括属性、实体及实体间的联系。
? 整体概念结构能满足需要分析阶段所确定的
所有要求。
An Introduction to Database System
验证整体概念结构(续)
? 整体概念结构最终还应该提交给用户,
征求用户和有关人员的意见,进行评审、
修改和优化,然后把它确定下来,作为
数据库的概念结构,作为进一步设计数
据库的依据 。
An Introduction to Database System
数据库设计
? 数据库的设计过程
? 需求分析
? 概念结构设计
? 逻辑结构设计
? 物理数据库设计
? 实施
? 运行维护
设计过程中往往还会有许多反复。
An Introduction to Database System
概念结构设计小结
? 什么是概念结构设计
现实世界
机器世界
信息世界
需求分析
概念结构设计
An Introduction to Database System
概念结构设计小结
? 概念结构设计的步骤
? 抽象数据并设计局部视图
? 集成局部视图,得到全局概念结构
? 验证整体概念结构
An Introduction to Database System
概念结构设计小结
? 数据抽象
? 分类
? 聚集
? 概括
An Introduction to Database System
概念结构设计小结
? 设计局部视图
? ⒈ 选择局部应用
? ⒉ 逐一设计分 E-R图
? 标定局部应用中的实体、属性、码,实体
间的联系
? 用 E-R图描述出来
An Introduction to Database System
概念结构设计小结
? 集成局部视图
? 1.合并分 E-R图,生成初步 E-R图
? 消除冲突
? 属性冲突
? 命名冲突
? 结构冲突
? 2,修改与重构
? 消除不必要的冗余,设计生成基本 E-R图
? 分析方法
? 规范化理论
An Introduction to Database System
下课了。。。
休息一会儿。。。