西华师范大学计算机学院
第六章 数据库设计 (续 -1)
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
6.3.1 概念结构
? 什么是概念结构设计
– 将需求分析得到的用户需求抽象为信息结构
即概念模型的过程就是概念结构设计
– 概念结构是各种数据模型的共同基础,它比
数据模型更独立于机器、更抽象,从而更加
稳定。它是整个数据库设计的关键
概念结构(续)
现实世界
机器世界
信息世界
需求分析
概念结构设计
概念结构(续)
? 概念结构设计的特点
( 1)真实、充分地反映现实世界,包括事物和
事物之间的联系,能满足用户对数据的处理要
求。是对现实世界的一个真实模型。
( 2)易于理解,从而可以用它和不熟悉计算机
的用户交换意见,用户的积极参与是数据库的
设计成功的关键。
概念结构(续)
? 概念结构设计的特点 (续 )
( 3)易于更改,当应用环境和应用要求改变时,
容易对概念模型修改和扩充。
( 4)易于向关系、网状、层次等各种数据模型
转换。
概念结构(续)
? 描述概念模型的工具
– 包括各种语义数据模型,面向对象数据模型
等
– 目前应用得最广泛的是 E―R 数据模型及其
扩充版本 (EER)。
? 用 E―R 数据模型设计数据模式:
– 首先必须根据需求说明, 确认实体, 联系和
属性 。
? 如前所述, 实体, 联系和属性的区分不是绝对的 。
属性和联系都可以看成是实体 。 概念设计所产生的模
式本来就要求比较自然地反映现实世界 。 因此, 实
体, 属性和联系的划分实质上反映了数据库设计者
和用户对现实世界的理解和观察 。 对于同一个单位,
不同的设计者可能设计出不同的数据模式 。
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
6.3.2 概念结构设计的方法与步骤
? 设计概念结构的四类方法
– 自顶向下
? 首先定义全局概念结构的框架,然后逐
步细化
– 自底向上
? 首先定义各局部应用的概念结构,然后
将它们集成起来,得到全局概念结构
概念结构设计的方法与步骤(续)
– 逐步扩张
? 首先定义最重要的核心概念结构,然后向外扩
充,以滚雪球的方式逐步生成其他概念结构,直
至总体概念结构
? 以学生视图为例,先表示有关学生的基本数据,再表示
诸如课外活动,兴趣小组,家庭情况等有关的其他数据。
– 混合策略
? 将自顶向下和自底向上相结合,用自顶向下策
略设计一个全局概念结构的框架,以它为骨架集
成由自底向上策略中设计的各局部概念结构。
概念结构设计的方法与步骤(续)
自顶向下策略
概念结构设计的方法与步骤(续)
自底向上策略
概念结构设计的方法与步骤(续)
逐步扩张
概念结构设计的方法与步骤(续)
? 常用策略( P215图 6.8)
– 自顶向下地进行需求分析
– 自底向上地设计概念结构
? 自底向上设计概念结构的步骤
( P216图 6.9)
– 第 1步:抽象数据并设计局部视图
– 第 2步:集成局部视图,得到全局概念结构
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
6.3.3 数据抽象与局部视图设计
? 数据抽象
? 局部视图设计
一、数据抽象
? 概念结构是对现实世界的一种抽象
– 从实际的人、物、事和概念中抽取所关心的
共同特性,忽略非本质的细节
– 把这些特性用各种概念精确地加以描述
– 这些概念组成了某种模型
数据抽象(续)
? 三种常用抽象
1,分类( Classification)
– 定义某一类概念作为现实世界中一组对象的类型
– 这些对象具有某些共同的特性和行为
– 它抽象了对象 值和型 之间的,is member of”的语义
– 在 E-R模型中,实体型就是这种抽象
学 生
张英 王平 刘勇 …… 赵亮
“is member of”
数据抽象(续)
2,聚集( Aggregation)
– 定义某一类型的组成成分
– 它抽象了对象内部类型和成分之间,is part of”的
语义
– 在 E-R模型中若干属性的聚集组成了实体型,就
是这种抽象
学 生
学号 姓名 专业 班级
“is part of,
实体型
属性
数据抽象(续)
3,概括( Generalization)
– 定义类型之间的一种子集联系
– 它抽象了类型之间的, is subset of”的语义
– 概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽
象。
注:原 E-R模型不具有概括,扩充 E-R模型允许定义超类实体型和子类实体
型。
? 用双竖边的矩形框表示子类,
? 用直线加小圆圈表示超类 -子类的联系
学 生
本科生 研究生
“is subset of,
数据抽象(续)
? 数据抽象的用途
– 对需求分析阶段收集到的数据进行分类、组
织(聚集),形成
? 实体
? 实体的属性,标识实体的码
? 确定实体之间的联系类型 (1:1,1:n,m:n)
二、局部视图设计
设计分 E-R图的步骤,
⒈ 选择局部应用
⒉逐一设计分 E-R图
⒈ 选择局部应用
? 设计分 E-R图首先需要根据系统的具体情
况,在多层的数据流图中 选择 一个 适当
层次的数据流图,让这组图中每一部分
对应一个局部应用,然后以这一层次的
数据流图为出发点,设计分 E-R图。
选择局部应用(续)
? 通常以中层数据流图作为设计分 E-R
图的依据。原因:
– 高层数据流图只能反映系统的概貌
– 中层数据流图能较好地反映系统中各局部应
用的子系统组成
– 低层数据流图过细
⒉ 逐一设计分 E-R图
? 任务
– 标定局部应用中的实体、属性、码,实体间
的联系
? 将各局部应用涉及的数据分别从数据字典
中抽取出来,参照数据流图,标定各局部
应用中的实体、实体的属性、标识实体的
码,确定实体之间的联系及其类型( 1:1,
1:n,m:n)
逐一设计分 E-R图(续)
? 如何抽象实体和属性
– 实体,现实世界中一组具有某些共同特性和
行为的对象就可以抽象为一个实体。对象和
实体之间是,is member of"的关系。
例:在学校环境中,可把张三、李四等对象抽
象为学生实体。
逐一设计分 E-R图(续)
– 属性,对象类型的组成成分可以抽象为实体
的属性。组成成分与对象类型之间是,is
part of"的关系。
例:学号、姓名、专业、年级等可以抽象为学
生实体的属性。其中学号为标识学生实体的码。
逐一设计分 E-R图(续)
? 如何区分实体和属性
– 实体与属性是相对而言的 。同一事物,在一
种应用环境中作为“属性”,在另一种应用
环境中就必须作为“实体”。
例:学校中的系,在某种应用环境中,它只
是作为“学生”实体的一个属性,表明一个
学生属于哪个系;而在另一种环境中,由于
需要考虑一个系的系主任、教师人数、学生
人数、办公地点等,它就需要作为实体。
逐一设计分 E-R图(续)
– 一般原则
? 属性不能再具有需要描述的性质。即属性
必须是不可分的数据项,不能再由另一些
属性组成。
? 属性不能与其他实体具有联系。 联系只发
生在实体之间 。
– 符合上述两条特性的事物一般作为属性对待。
– 为了简化 E-R图的处置,现实世界中的事物
凡能够作为属性对待的,应尽量作为属性。
逐一设计分 E-R图(续)
– 举例
例 1:“学生”由学号、姓名等属性进一步描
述,根据准则1,“学生”只能作为实体,
不能作为属性。
例 2:职称通常作为教师实体的属性,但在涉
及住房分配时,由于分房与职称有关,也就
是说职称与住房实体之间有联系,根据准则
2,这时把职称作为实体来处理会更合适些。
职 工
职工号 职工号 职工号 职工号
职工 聘 任 职称
职工号 姓名 年龄 职工代码 工资 住房标准 附加福利
图 6.15 职称做为一个实体
逐一设计分 E-R图(续)
? 设计分 E-R图的步骤
– ( 1)以数据字典为出发点定义 E-R图。
? 数据字典中的“数据结构”、“数据流”
和“数据存储”等已是若干属性的有意义
的聚合
– ( 2)按上面给出的准则进行必要的调整。
需求分析结果
确定局部结构范围
实体定义
联系定义
属性分配
还有局部
结构待分
析
有
无 进入全局 ER模式设计
局部 ER模式设计
范围的划分要自然,
易于管理;
范围的大小要适度。太小
了,会造成局部结构过多,
设计过程繁琐,综合困难;
太大了,则容易造成内部
结构复杂,不便分析
范围之间的界面要清晰,
相互影响要小
采用人们习惯的划分;
避免冗余, 在一个局部结
构中, 对一个对象只取一
种抽象形式, 不要重复;
依据用户的信息处理需求
确定属性的原则:
属性应该是不可再分解的语义
单位;实体与属性之间的关系只能
是 1:N的;不同实体类型的属性之间
应无直接关联关系。
属性分配的原则:
当多个实体类型用到同一属性时,
一般把属性分配给那些使用频率最高
的实体类型,或分配给实体值少的实
体类型。
有些属性不宜归属于任一实体类
型,只说明实体之间联系的特性
局部模式
现有的教学
管理系统
初步分析系
统的对象
根据服务种
类分析教师
子模块
…… 局部 ER图
其他局部模式
现有的教学
管理系统
初步分析系
统的对象
根据服务种
类分析学生
子模块 ……
导师
班级
学生
组
成
管
理
班主任
档案材料 宿舍住
宿
归
档
指
导
系 有
参
加
学会
1 N 1 1
1
N
N
N 1
1
N
M
N 1
具
有
社会关系
1
N
局部 ER图
其它局部模式
现有的教学
管理系统
初步分析系
统的对象
根据服务种
类分析课程
子模块
……
局部 ER图
图 5.22 课程管理局部应用分 E-R图
1
教室
M
1
教科书 教师
担任
课程系 开设
N1
学生选修
N M
上课
P N
6.3 概念结构设计
6.3.1 概念结构
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
6.3.4 视图的集成
? 各个局部视图即分 E-R图建立好后,还需
要对它们进行合并,集成为一个整体的
数据概念结构即总 E-R图。
视图的集成(续)
? 视图集成的两种方式
– 一次集成
? 一次集成多个分 E-R图
? 通常用于局部视图比较简单时
– 逐步累积式
? 首先集成两个局部视图(通常是比较关键
的两个局部视图)
? 以后每次将一个新的局部视图集成进来
* 多个分 E-R图一次集成,(a)
*逐步集成,用累加的方式一次集成两个分 E-R图, (b)
(E-R)1 (E-R)2 (E-R)n…
…
基本 E-R
初步 E-R
(E-R)3(E-R)12
(E-R)2(E-R)1
初步 E-R
基本 E-R
…
(a) (b)
图 6.25 视图集成的两种方式
视图的集成(续)
? 集成局部 E-R图的步骤
1,合并
2,修改与重构
无
全局 ER模式设计
局部 ER模式
确定公共实体类型
合并两个局部 ER模式
检查并消除冲突
还有未合
并的局部
模式
有
还有冲突吗 有
属性冲突, 如,重量单位
有的用公斤,有的用克。
结构冲突, 同一对象在不
同应用中的不同抽象 ; 同
一实体在不同局部 ER图中
属性的个数或次序不同 ;
实体之间的联系在不同的
局部 ER图中呈现不同的类
型
命名冲突, 属性名、实体
名、联系名之间存在同名
异义或异名同义冲突
视图的集成(续)
一、合并分 E-R图,生成初步 E-R图
? 各分E-R图存在冲突
– 各个局部应用所面向的问题不同
由不同的设计人员进行设计
各个分 E-R图之间必定会存在许多不一致的地方
– 合并分 E-R图的主要工作与关键所在:合理消除各
分 E-R图的冲突
合并分 E-R图,生成初步 E-R图(续)
? 冲突的种类
– 属性冲突
– 命名冲突
– 结构冲突
⒈ 属性冲突
? 两类属性冲突
– 属性域冲突,属性值的类型、取值范围或取
值集合不同。
例 1,由于学号是数字,因此某些部门(即局
部应用)将学号定义为整数形式,而由于学号
不用参与运算,因此另一些部门(即局部应用)
将学号定义为字符型形式。
例 2,某些部门(即局部应用)以出生日期形
式表示学生的年龄,而另一些部门(即局部应
用)用整数形式表示学生的年龄。
属性冲突(续)
– 属性取值单位冲突 。
例:学生的身高,有的以米为单位,有的以厘
米为单位,有的以尺为单位。
? 属性冲突的解决方法
? 通常用讨论、协商等行政手段加以解决
⒉ 命名冲突
? 两类命名冲突
– 同名异义,不同意义的对象在不同的局部应用中具
有相同的名字
例,局部应用 A中将教室称为房间
局部应用 B中将学生宿舍称为房间
– 异名同义(一义多名),同一意义的对象在不同的
局部应用中具有不同的名字
例,有的部门把教科书称为课本
有的部门则把教科书称为教材
命名冲突(续)
? 命名冲突可能发生在属性级、实体级、
联系级上。其中属性的命名冲突更为常
见。
? 命名冲突的解决方法
– 通过讨论、协商等行政手段加以解决
⒊ 结构冲突
? 三类结构冲突
– 同一对象在不同应用中具有不同的抽象
例,“课程”在某一局部应用中被当作实体
在另一局部应用中则被当作属性
? 解决方法:通常是把属性变换为实体或把
实体变换为属性,使同一对象具有相同的
抽象。变换时要遵循两个准则。
结构冲突(续)
– 同一实体在不同局部视图中所包含的属性不
完全相同,或者属性的排列次序不完全相同 。
? 产生原因:不同的局部应用关心的是该实
体的不同侧面。
? 解决方法:使该实体的属性取各分 E-R图
中属性的并集,再适当设计属性的次序 。
结构冲突(续)
学生
学号 姓名 性别 平均成绩
(a)在局部应用 A中
结构冲突(续)
学生
学号姓名 出生日期 年级
(b)在局部应用 B中
所在系
结构冲突(续)
学生
学号姓名 政治面貌
(c)在局部应用 C中
结构冲突(续)
学生
政治
面貌学号
出生
日期 年级
(d)合并后
所在系 平均成绩姓名 性别
结构冲突(续)
– 实体之间的联系在不同局部视图中呈现不同
的类型
例 1,实体 E1与 E2在局部应用 A中是多对多
联系,而在局部应用 B中是一对多联系
例 2,在局部应用 X中 E1与 E2发生联系,而
在局部应用 Y中 E1,E2,E3三者之间有联系。
? 解决方法:根据应用语义对实体联系的类
型进行综合或调整。 (P226图 6.27)
例子:三个局部 ER图合并成一个 ER图
1
合并后的教学管理 E-R图
1
N
1
P
1N
1
N
1 N
1
M
M NN
N
N
社会关系
具有
1
N
N
M
1
系
聘用
承接项目
参加
设置
院长 学院主管
N
N
1
1
1
教师
评定
职称
分配
工作量
1 1
1
N
档案材料
归档
参加
学会
1
宿舍住宿
教科书
担任
指导
课程
选修
教室
上课
有
1
班级
学生
组成
N
开设
N
管理
1
1
教师
管理
1
1
二、修改与重构
? 基本任务
– 消除不必要的冗余,设计生成基本 E-R图
合并
初步 E-R图
分 E-R图
可能存在冗余的数据
和冗余的实体间联系
基本 E-R图
消除不必要的冗余
修改与重构(续)
1.冗余
2.消除冗余的方法
1.冗余
? 冗余的数据是指可由基本数据导出的数据,
冗余的联系是指可由其他联系导出的联系。
? 冗余数据和冗余联系容易破坏数据库的完整性,
给数据库维护增加困难
? 并不是所有的冗余数据与冗余联系都必须加以
消除,有时为了提高某些应用的效率,不得不
以冗余信息作为代价。
冗余(续)
? 设计数据库概念结构时,哪些冗余信息必须消
除,哪些冗余信息允许存在,需要根据用户的
整体需求来确定。
? 消除不必要的冗余后的初步 E-R图称为基本 E-R
图。
2.消除冗余的方法
? 分析方法
– 以数据字典和数据流图为依据,根据数据字典中关
于数据项之间逻辑关系的说明来消除冗余。
消除冗余的方法 (续 )
例,教师工资单中包括该教师的基本工资、各
种补贴、应扣除的房租水电费以及实发工资。
由于实发工资可以由前面各项推算出来,因此
可以去掉,在需要查询实发工资时根据基本工
资、各种补贴、应扣除的房租水电费数据临时
生成。
消除冗余的方法(续)
– 如果是为了提高效率,人为地保留了一些冗
余数据,则应把数据字典中数据关联的说明
作为完整性约束条件。
– 一种更好的方法是把冗余数据定义在视图中
消除冗余的方法(续)
– 方法
1,确定分 E-R图实体之间的数据依赖 FL 。实体之间一对一、
一对多、多对多的联系可以用实体码之间的函数依赖来
表示。
例:
班级和学生之间一对多的联系:
学号 ?班级号
学生和课程之间多对多的联系:
(学号,课程号) ?成绩
? 规范化理论
? 函数依赖的概念提供了消除冗余联系的形式化工具
消除冗余的方法(续)
2,求 FL的最小覆盖 GL,差集为
D = FL-GL。
逐一考察 D中的函数依赖,确定是否是冗余
的联系,若是,就把它去掉。
消除冗余的方法(续)
– 由于规范化理论受到泛关系假设的限制,应注意下
面两个问题:
1.冗余的联系一定在 D中,而 D中的联系不一定是冗余
的;
2.当实体之间存在多种联系时要将实体之间的联系在
形式上加以区分。
例 P229图 6.30中
部门和职工之间两种联系表示为:
负责人,职工号 ?部门号
部门号 ?负责人,职工号
三、验证整体概念结构
? 视图集成后形成一个整体的数据库概念结构,对该整
体概念结构还必须进行进一步验证,确保它能够满足
下列条件,
– 整体概念结构内部必须具有一致性,不存在互相矛
盾的表达。
– 整体概念结构能准确地反映原来的每个视图结构,
包括属性、实体及实体间的联系。
– 整体概念结构能满足需要分析阶段所确定的所有要
求。
验证整体概念结构(续)
? 整体概念结构最终还应该提交给用户,
征求用户和有关人员的意见,进行评审、
修改和优化,然后把它确定下来,作为
数据库的概念结构,作为进一步设计数
据库的依据 。
数据库设计
? 数据库的设计过程
– 需求分析
– 概念结构设计
– 逻辑结构设计
– 物理数据库设计
– 实施
– 运行维护
设计过程中往往还会有许多反复。
概念结构设计小结
? 什么是概念结构设计
现实世界
机器世界
信息世界
需求分析
概念结构设计
概念结构设计小结
? 概念结构设计的步骤
– 抽象数据并设计局部视图
– 集成局部视图,得到全局概念结构
– 验证整体概念结构
概念结构设计小结
? 数据抽象
– 分类
– 聚集
– 概括
概念结构设计小结
? 设计局部视图
– ⒈ 选择局部应用
– ⒉ 逐一设计分 E-R图
? 标定局部应用中的实体、属性、码,实体
间的联系
? 用 E-R图描述出来
概念结构设计小结
? 集成局部视图
– 1.合并分 E-R图,生成初步 E-R图
? 消除冲突
– 属性冲突
– 命名冲突
– 结构冲突
– 2,修改与重构
? 消除不必要的冗余,设计生成基本 E-R图
– 分析方法
– 规范化理论
第六章 数据库设计 (续 -1)
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
6.3.1 概念结构
? 什么是概念结构设计
– 将需求分析得到的用户需求抽象为信息结构
即概念模型的过程就是概念结构设计
– 概念结构是各种数据模型的共同基础,它比
数据模型更独立于机器、更抽象,从而更加
稳定。它是整个数据库设计的关键
概念结构(续)
现实世界
机器世界
信息世界
需求分析
概念结构设计
概念结构(续)
? 概念结构设计的特点
( 1)真实、充分地反映现实世界,包括事物和
事物之间的联系,能满足用户对数据的处理要
求。是对现实世界的一个真实模型。
( 2)易于理解,从而可以用它和不熟悉计算机
的用户交换意见,用户的积极参与是数据库的
设计成功的关键。
概念结构(续)
? 概念结构设计的特点 (续 )
( 3)易于更改,当应用环境和应用要求改变时,
容易对概念模型修改和扩充。
( 4)易于向关系、网状、层次等各种数据模型
转换。
概念结构(续)
? 描述概念模型的工具
– 包括各种语义数据模型,面向对象数据模型
等
– 目前应用得最广泛的是 E―R 数据模型及其
扩充版本 (EER)。
? 用 E―R 数据模型设计数据模式:
– 首先必须根据需求说明, 确认实体, 联系和
属性 。
? 如前所述, 实体, 联系和属性的区分不是绝对的 。
属性和联系都可以看成是实体 。 概念设计所产生的模
式本来就要求比较自然地反映现实世界 。 因此, 实
体, 属性和联系的划分实质上反映了数据库设计者
和用户对现实世界的理解和观察 。 对于同一个单位,
不同的设计者可能设计出不同的数据模式 。
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
6.3.2 概念结构设计的方法与步骤
? 设计概念结构的四类方法
– 自顶向下
? 首先定义全局概念结构的框架,然后逐
步细化
– 自底向上
? 首先定义各局部应用的概念结构,然后
将它们集成起来,得到全局概念结构
概念结构设计的方法与步骤(续)
– 逐步扩张
? 首先定义最重要的核心概念结构,然后向外扩
充,以滚雪球的方式逐步生成其他概念结构,直
至总体概念结构
? 以学生视图为例,先表示有关学生的基本数据,再表示
诸如课外活动,兴趣小组,家庭情况等有关的其他数据。
– 混合策略
? 将自顶向下和自底向上相结合,用自顶向下策
略设计一个全局概念结构的框架,以它为骨架集
成由自底向上策略中设计的各局部概念结构。
概念结构设计的方法与步骤(续)
自顶向下策略
概念结构设计的方法与步骤(续)
自底向上策略
概念结构设计的方法与步骤(续)
逐步扩张
概念结构设计的方法与步骤(续)
? 常用策略( P215图 6.8)
– 自顶向下地进行需求分析
– 自底向上地设计概念结构
? 自底向上设计概念结构的步骤
( P216图 6.9)
– 第 1步:抽象数据并设计局部视图
– 第 2步:集成局部视图,得到全局概念结构
6.3 概念结构设计
6.3.1 概念结构设计概述
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
6.3.3 数据抽象与局部视图设计
? 数据抽象
? 局部视图设计
一、数据抽象
? 概念结构是对现实世界的一种抽象
– 从实际的人、物、事和概念中抽取所关心的
共同特性,忽略非本质的细节
– 把这些特性用各种概念精确地加以描述
– 这些概念组成了某种模型
数据抽象(续)
? 三种常用抽象
1,分类( Classification)
– 定义某一类概念作为现实世界中一组对象的类型
– 这些对象具有某些共同的特性和行为
– 它抽象了对象 值和型 之间的,is member of”的语义
– 在 E-R模型中,实体型就是这种抽象
学 生
张英 王平 刘勇 …… 赵亮
“is member of”
数据抽象(续)
2,聚集( Aggregation)
– 定义某一类型的组成成分
– 它抽象了对象内部类型和成分之间,is part of”的
语义
– 在 E-R模型中若干属性的聚集组成了实体型,就
是这种抽象
学 生
学号 姓名 专业 班级
“is part of,
实体型
属性
数据抽象(续)
3,概括( Generalization)
– 定义类型之间的一种子集联系
– 它抽象了类型之间的, is subset of”的语义
– 概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽
象。
注:原 E-R模型不具有概括,扩充 E-R模型允许定义超类实体型和子类实体
型。
? 用双竖边的矩形框表示子类,
? 用直线加小圆圈表示超类 -子类的联系
学 生
本科生 研究生
“is subset of,
数据抽象(续)
? 数据抽象的用途
– 对需求分析阶段收集到的数据进行分类、组
织(聚集),形成
? 实体
? 实体的属性,标识实体的码
? 确定实体之间的联系类型 (1:1,1:n,m:n)
二、局部视图设计
设计分 E-R图的步骤,
⒈ 选择局部应用
⒉逐一设计分 E-R图
⒈ 选择局部应用
? 设计分 E-R图首先需要根据系统的具体情
况,在多层的数据流图中 选择 一个 适当
层次的数据流图,让这组图中每一部分
对应一个局部应用,然后以这一层次的
数据流图为出发点,设计分 E-R图。
选择局部应用(续)
? 通常以中层数据流图作为设计分 E-R
图的依据。原因:
– 高层数据流图只能反映系统的概貌
– 中层数据流图能较好地反映系统中各局部应
用的子系统组成
– 低层数据流图过细
⒉ 逐一设计分 E-R图
? 任务
– 标定局部应用中的实体、属性、码,实体间
的联系
? 将各局部应用涉及的数据分别从数据字典
中抽取出来,参照数据流图,标定各局部
应用中的实体、实体的属性、标识实体的
码,确定实体之间的联系及其类型( 1:1,
1:n,m:n)
逐一设计分 E-R图(续)
? 如何抽象实体和属性
– 实体,现实世界中一组具有某些共同特性和
行为的对象就可以抽象为一个实体。对象和
实体之间是,is member of"的关系。
例:在学校环境中,可把张三、李四等对象抽
象为学生实体。
逐一设计分 E-R图(续)
– 属性,对象类型的组成成分可以抽象为实体
的属性。组成成分与对象类型之间是,is
part of"的关系。
例:学号、姓名、专业、年级等可以抽象为学
生实体的属性。其中学号为标识学生实体的码。
逐一设计分 E-R图(续)
? 如何区分实体和属性
– 实体与属性是相对而言的 。同一事物,在一
种应用环境中作为“属性”,在另一种应用
环境中就必须作为“实体”。
例:学校中的系,在某种应用环境中,它只
是作为“学生”实体的一个属性,表明一个
学生属于哪个系;而在另一种环境中,由于
需要考虑一个系的系主任、教师人数、学生
人数、办公地点等,它就需要作为实体。
逐一设计分 E-R图(续)
– 一般原则
? 属性不能再具有需要描述的性质。即属性
必须是不可分的数据项,不能再由另一些
属性组成。
? 属性不能与其他实体具有联系。 联系只发
生在实体之间 。
– 符合上述两条特性的事物一般作为属性对待。
– 为了简化 E-R图的处置,现实世界中的事物
凡能够作为属性对待的,应尽量作为属性。
逐一设计分 E-R图(续)
– 举例
例 1:“学生”由学号、姓名等属性进一步描
述,根据准则1,“学生”只能作为实体,
不能作为属性。
例 2:职称通常作为教师实体的属性,但在涉
及住房分配时,由于分房与职称有关,也就
是说职称与住房实体之间有联系,根据准则
2,这时把职称作为实体来处理会更合适些。
职 工
职工号 职工号 职工号 职工号
职工 聘 任 职称
职工号 姓名 年龄 职工代码 工资 住房标准 附加福利
图 6.15 职称做为一个实体
逐一设计分 E-R图(续)
? 设计分 E-R图的步骤
– ( 1)以数据字典为出发点定义 E-R图。
? 数据字典中的“数据结构”、“数据流”
和“数据存储”等已是若干属性的有意义
的聚合
– ( 2)按上面给出的准则进行必要的调整。
需求分析结果
确定局部结构范围
实体定义
联系定义
属性分配
还有局部
结构待分
析
有
无 进入全局 ER模式设计
局部 ER模式设计
范围的划分要自然,
易于管理;
范围的大小要适度。太小
了,会造成局部结构过多,
设计过程繁琐,综合困难;
太大了,则容易造成内部
结构复杂,不便分析
范围之间的界面要清晰,
相互影响要小
采用人们习惯的划分;
避免冗余, 在一个局部结
构中, 对一个对象只取一
种抽象形式, 不要重复;
依据用户的信息处理需求
确定属性的原则:
属性应该是不可再分解的语义
单位;实体与属性之间的关系只能
是 1:N的;不同实体类型的属性之间
应无直接关联关系。
属性分配的原则:
当多个实体类型用到同一属性时,
一般把属性分配给那些使用频率最高
的实体类型,或分配给实体值少的实
体类型。
有些属性不宜归属于任一实体类
型,只说明实体之间联系的特性
局部模式
现有的教学
管理系统
初步分析系
统的对象
根据服务种
类分析教师
子模块
…… 局部 ER图
其他局部模式
现有的教学
管理系统
初步分析系
统的对象
根据服务种
类分析学生
子模块 ……
导师
班级
学生
组
成
管
理
班主任
档案材料 宿舍住
宿
归
档
指
导
系 有
参
加
学会
1 N 1 1
1
N
N
N 1
1
N
M
N 1
具
有
社会关系
1
N
局部 ER图
其它局部模式
现有的教学
管理系统
初步分析系
统的对象
根据服务种
类分析课程
子模块
……
局部 ER图
图 5.22 课程管理局部应用分 E-R图
1
教室
M
1
教科书 教师
担任
课程系 开设
N1
学生选修
N M
上课
P N
6.3 概念结构设计
6.3.1 概念结构
6.3.2 概念结构设计的方法与步骤
6.3.3 数据抽象与局部视图设计
6.3.4 视图的集成
6.3.4 视图的集成
? 各个局部视图即分 E-R图建立好后,还需
要对它们进行合并,集成为一个整体的
数据概念结构即总 E-R图。
视图的集成(续)
? 视图集成的两种方式
– 一次集成
? 一次集成多个分 E-R图
? 通常用于局部视图比较简单时
– 逐步累积式
? 首先集成两个局部视图(通常是比较关键
的两个局部视图)
? 以后每次将一个新的局部视图集成进来
* 多个分 E-R图一次集成,(a)
*逐步集成,用累加的方式一次集成两个分 E-R图, (b)
(E-R)1 (E-R)2 (E-R)n…
…
基本 E-R
初步 E-R
(E-R)3(E-R)12
(E-R)2(E-R)1
初步 E-R
基本 E-R
…
(a) (b)
图 6.25 视图集成的两种方式
视图的集成(续)
? 集成局部 E-R图的步骤
1,合并
2,修改与重构
无
全局 ER模式设计
局部 ER模式
确定公共实体类型
合并两个局部 ER模式
检查并消除冲突
还有未合
并的局部
模式
有
还有冲突吗 有
属性冲突, 如,重量单位
有的用公斤,有的用克。
结构冲突, 同一对象在不
同应用中的不同抽象 ; 同
一实体在不同局部 ER图中
属性的个数或次序不同 ;
实体之间的联系在不同的
局部 ER图中呈现不同的类
型
命名冲突, 属性名、实体
名、联系名之间存在同名
异义或异名同义冲突
视图的集成(续)
一、合并分 E-R图,生成初步 E-R图
? 各分E-R图存在冲突
– 各个局部应用所面向的问题不同
由不同的设计人员进行设计
各个分 E-R图之间必定会存在许多不一致的地方
– 合并分 E-R图的主要工作与关键所在:合理消除各
分 E-R图的冲突
合并分 E-R图,生成初步 E-R图(续)
? 冲突的种类
– 属性冲突
– 命名冲突
– 结构冲突
⒈ 属性冲突
? 两类属性冲突
– 属性域冲突,属性值的类型、取值范围或取
值集合不同。
例 1,由于学号是数字,因此某些部门(即局
部应用)将学号定义为整数形式,而由于学号
不用参与运算,因此另一些部门(即局部应用)
将学号定义为字符型形式。
例 2,某些部门(即局部应用)以出生日期形
式表示学生的年龄,而另一些部门(即局部应
用)用整数形式表示学生的年龄。
属性冲突(续)
– 属性取值单位冲突 。
例:学生的身高,有的以米为单位,有的以厘
米为单位,有的以尺为单位。
? 属性冲突的解决方法
? 通常用讨论、协商等行政手段加以解决
⒉ 命名冲突
? 两类命名冲突
– 同名异义,不同意义的对象在不同的局部应用中具
有相同的名字
例,局部应用 A中将教室称为房间
局部应用 B中将学生宿舍称为房间
– 异名同义(一义多名),同一意义的对象在不同的
局部应用中具有不同的名字
例,有的部门把教科书称为课本
有的部门则把教科书称为教材
命名冲突(续)
? 命名冲突可能发生在属性级、实体级、
联系级上。其中属性的命名冲突更为常
见。
? 命名冲突的解决方法
– 通过讨论、协商等行政手段加以解决
⒊ 结构冲突
? 三类结构冲突
– 同一对象在不同应用中具有不同的抽象
例,“课程”在某一局部应用中被当作实体
在另一局部应用中则被当作属性
? 解决方法:通常是把属性变换为实体或把
实体变换为属性,使同一对象具有相同的
抽象。变换时要遵循两个准则。
结构冲突(续)
– 同一实体在不同局部视图中所包含的属性不
完全相同,或者属性的排列次序不完全相同 。
? 产生原因:不同的局部应用关心的是该实
体的不同侧面。
? 解决方法:使该实体的属性取各分 E-R图
中属性的并集,再适当设计属性的次序 。
结构冲突(续)
学生
学号 姓名 性别 平均成绩
(a)在局部应用 A中
结构冲突(续)
学生
学号姓名 出生日期 年级
(b)在局部应用 B中
所在系
结构冲突(续)
学生
学号姓名 政治面貌
(c)在局部应用 C中
结构冲突(续)
学生
政治
面貌学号
出生
日期 年级
(d)合并后
所在系 平均成绩姓名 性别
结构冲突(续)
– 实体之间的联系在不同局部视图中呈现不同
的类型
例 1,实体 E1与 E2在局部应用 A中是多对多
联系,而在局部应用 B中是一对多联系
例 2,在局部应用 X中 E1与 E2发生联系,而
在局部应用 Y中 E1,E2,E3三者之间有联系。
? 解决方法:根据应用语义对实体联系的类
型进行综合或调整。 (P226图 6.27)
例子:三个局部 ER图合并成一个 ER图
1
合并后的教学管理 E-R图
1
N
1
P
1N
1
N
1 N
1
M
M NN
N
N
社会关系
具有
1
N
N
M
1
系
聘用
承接项目
参加
设置
院长 学院主管
N
N
1
1
1
教师
评定
职称
分配
工作量
1 1
1
N
档案材料
归档
参加
学会
1
宿舍住宿
教科书
担任
指导
课程
选修
教室
上课
有
1
班级
学生
组成
N
开设
N
管理
1
1
教师
管理
1
1
二、修改与重构
? 基本任务
– 消除不必要的冗余,设计生成基本 E-R图
合并
初步 E-R图
分 E-R图
可能存在冗余的数据
和冗余的实体间联系
基本 E-R图
消除不必要的冗余
修改与重构(续)
1.冗余
2.消除冗余的方法
1.冗余
? 冗余的数据是指可由基本数据导出的数据,
冗余的联系是指可由其他联系导出的联系。
? 冗余数据和冗余联系容易破坏数据库的完整性,
给数据库维护增加困难
? 并不是所有的冗余数据与冗余联系都必须加以
消除,有时为了提高某些应用的效率,不得不
以冗余信息作为代价。
冗余(续)
? 设计数据库概念结构时,哪些冗余信息必须消
除,哪些冗余信息允许存在,需要根据用户的
整体需求来确定。
? 消除不必要的冗余后的初步 E-R图称为基本 E-R
图。
2.消除冗余的方法
? 分析方法
– 以数据字典和数据流图为依据,根据数据字典中关
于数据项之间逻辑关系的说明来消除冗余。
消除冗余的方法 (续 )
例,教师工资单中包括该教师的基本工资、各
种补贴、应扣除的房租水电费以及实发工资。
由于实发工资可以由前面各项推算出来,因此
可以去掉,在需要查询实发工资时根据基本工
资、各种补贴、应扣除的房租水电费数据临时
生成。
消除冗余的方法(续)
– 如果是为了提高效率,人为地保留了一些冗
余数据,则应把数据字典中数据关联的说明
作为完整性约束条件。
– 一种更好的方法是把冗余数据定义在视图中
消除冗余的方法(续)
– 方法
1,确定分 E-R图实体之间的数据依赖 FL 。实体之间一对一、
一对多、多对多的联系可以用实体码之间的函数依赖来
表示。
例:
班级和学生之间一对多的联系:
学号 ?班级号
学生和课程之间多对多的联系:
(学号,课程号) ?成绩
? 规范化理论
? 函数依赖的概念提供了消除冗余联系的形式化工具
消除冗余的方法(续)
2,求 FL的最小覆盖 GL,差集为
D = FL-GL。
逐一考察 D中的函数依赖,确定是否是冗余
的联系,若是,就把它去掉。
消除冗余的方法(续)
– 由于规范化理论受到泛关系假设的限制,应注意下
面两个问题:
1.冗余的联系一定在 D中,而 D中的联系不一定是冗余
的;
2.当实体之间存在多种联系时要将实体之间的联系在
形式上加以区分。
例 P229图 6.30中
部门和职工之间两种联系表示为:
负责人,职工号 ?部门号
部门号 ?负责人,职工号
三、验证整体概念结构
? 视图集成后形成一个整体的数据库概念结构,对该整
体概念结构还必须进行进一步验证,确保它能够满足
下列条件,
– 整体概念结构内部必须具有一致性,不存在互相矛
盾的表达。
– 整体概念结构能准确地反映原来的每个视图结构,
包括属性、实体及实体间的联系。
– 整体概念结构能满足需要分析阶段所确定的所有要
求。
验证整体概念结构(续)
? 整体概念结构最终还应该提交给用户,
征求用户和有关人员的意见,进行评审、
修改和优化,然后把它确定下来,作为
数据库的概念结构,作为进一步设计数
据库的依据 。
数据库设计
? 数据库的设计过程
– 需求分析
– 概念结构设计
– 逻辑结构设计
– 物理数据库设计
– 实施
– 运行维护
设计过程中往往还会有许多反复。
概念结构设计小结
? 什么是概念结构设计
现实世界
机器世界
信息世界
需求分析
概念结构设计
概念结构设计小结
? 概念结构设计的步骤
– 抽象数据并设计局部视图
– 集成局部视图,得到全局概念结构
– 验证整体概念结构
概念结构设计小结
? 数据抽象
– 分类
– 聚集
– 概括
概念结构设计小结
? 设计局部视图
– ⒈ 选择局部应用
– ⒉ 逐一设计分 E-R图
? 标定局部应用中的实体、属性、码,实体
间的联系
? 用 E-R图描述出来
概念结构设计小结
? 集成局部视图
– 1.合并分 E-R图,生成初步 E-R图
? 消除冲突
– 属性冲突
– 命名冲突
– 结构冲突
– 2,修改与重构
? 消除不必要的冗余,设计生成基本 E-R图
– 分析方法
– 规范化理论