An Introduction to Database System
中国人民大学信息学院计算机系
数据库系统概论
An Introduction to Database System
第六章 数据库设计 (续 -2)
An Introduction to Database System
第六章 数据库设计
6.1 数据库设计概述
6.2 需求分析
6.3 概念结构设计
6.4 逻辑结构设计
6.5 数据库的物理设计
6.6 数据库实施
6.7 数据库运行与维护
6.8 小结
An Introduction to Database System
6.4 逻辑结构设计
? 逻辑结构设计的任务
? 概念结构是各种数据模型的共同基础
? 为了能够用某一 DBMS实现用户需求,还必
须将概念结构进一步转化为相应的数据模型,
这正是数据库逻辑结构设计所要完成的任务。
An Introduction to Database System
6.4 逻辑结构设计
? 逻辑结构设计的步骤
? 将概念结构转化为一般的关系, 网状, 层次
模型
? 将转化来的关系, 网状, 层次模型向特定
DBMS支持下的数据模型转换
? 对数据模型进行优化
An Introduction to Database System
逻辑结构设计
转化为
一般数
据模型
转化为特
定 DBMS
支持下的
据模型
优化模
型 概念结
构设计
数据库
物理设计
基本 E-R图
转换规
则
特定
DBMS的
特点与限
制
优化方
法如规
范化理
论
逻辑
模型
An Introduction to Database System
6.4 逻辑结构设计
6.4.1 E-R图向关系模型的转换
6.4.2 向特定 DBMS规定的模型进行转换
6.4.3 数据模型的优化
6.4.4 设计用户子模式
An Introduction to Database System
6.4.1 E-R图向关系模型的转换
? 转换内容
? 转换原则
An Introduction to Database System
E-R图向关系模型的转换(续)
? 转换内容
? E-R图由实体、实体的属性和实体之间的联
系三个要素组成
? 关系模型的逻辑结构是一组关系模式的集合
? 将 E-R图转换为关系模型:将实体、实体的
属性和实体之间的联系转化为关系模式。
An Introduction to Database System
E-R图向关系模型的转换(续)
? 转换原则
⒈ 一个 实体型 转换为一个关系模式。
? 关系的属性,实体型的属性
? 关系的码,实体型的码
例,学生实体可以转换为如下关系模式,
学生( 学号,姓名,出生日期,所在系,
年级,平均成绩)
性别、宿舍、班级、档案材料、教师、课程、教室、
教科书都分别转换为一个关系模式。
An Introduction to Database System
学生
学号 出生 日期 年级 所在系 平均 成绩 姓名
An Introduction to Database System
E-R图向关系模型的转换(续)
⒉ 一个 m:n联系 转换为一个关系模式。
? 关系的属性,与该联系相连的各实体的码以
及联系本身的属性
? 关系的码,各实体码的组合
例,,选修, 联系是一个 m:n联系,可以将它
转换为如下关系模式,其中学号与课程号为关
系的组合码,
选修( 学号, 课程号,成绩)
An Introduction to Database System
E-R图向关系模型的转换(续)
⒊ 一个 1:n联系 可以转换为一个独立的关系模式,
也可以与 n端对应的关系模式合并。
? 1) 转换为一个独立的关系模式
? 关系的属性,与该联系相连的各实体的码
以及联系本身的属性
? 关系的码, n端实体的码
An Introduction to Database System
E-R图向关系模型的转换(续)
⒊ 一个 1:n联系 可以转换为一个独立的关系模式,
也可以与 n端对应的关系模式合并。
? 2) 与 n端对应的关系模式合并
? 合并后关系的属性,在 n端关系中加入 1端
关系的码和联系本身的属性
? 合并后关系的码,不变
? 可以减少系统中的关系个数,一般情况下更
倾向于采用这种方法
An Introduction to Database System
E-R图向关系模型的转换(续)
例,,组成, 联系为 1:n联系。
将其转换为关系模式的两种方法,
1)使其成为一个独立的关系模式,
组成( 学号,班级号)
2)将其学生关系模式合并,
学生( 学号,姓名,出生日期,所在系,
年级,班级号,平均成绩)
An Introduction to Database System
E-R图向关系模型的转换(续)
⒋ 一个 1:1联系可以转换为一个独立的关系模式,
也可以与任意一端对应的关系模式合并。
? 1) 转换为一个独立的关系模式
? 关系的属性,与该联系相连的各实体的码
以及联系本身的属性
? 关系的候选码,每个实体的码均是该关系
的候选码
An Introduction to Database System
E-R图向关系模型的转换(续)
⒋ 一个 1:1联系可以转换为一个独立的关系模式,
也可以与任意一端对应的关系模式合并。
? 2) 与某一端对应的关系模式合并
? 合并后关系的属性,加入对应关系的码和
联系本身的属性
? 合并后关系的码,不变
An Introduction to Database System
E-R图向关系模型的转换(续)
例,,管理, 联系为 1:1联系,可以有三种转换方法,
( 1)转换为一个独立的关系模式,
管理( 职工号,班级号)
或 管理(职工号,班级号 )
( 2), 管理, 联系与班级关系模式合并,则只需在班
级关系中加入教师关系的码,即职工号,
班级:( 班级号,学生人数,职工号 )
( 3), 管理, 联系与教师关系模式合并,则只需在教
师关系中加入班级关系的码,即班级号,
教师:( 职工号,姓名,性别,职称,班级号,
是否为优秀班主任)
An Introduction to Database System
E-R图向关系模型的转换(续)
注意,
? 从理论上讲,1:1联系可以与任意一端对应的关系模
式合并。
? 但在一些情况下,与不同的关系模式合并效率会大
不一样。因此究竟应该与哪端的关系模式合并需要
依应用的具体情况而定。
? 由于连接操作是最费时的操作,所以一般应以尽量
减少连接操作为目标。
例如,如果经常要查询某个班级的班主任姓名,则
将管理联系与教师关系合并更好些。
An Introduction to Database System
E-R图向关系模型的转换(续)
⒌ 三个或三个以上实体间的一个 多元联系 转换为
一个关系模式。
? 关系的属性,与该多元联系相连的各实体的
码以及联系本身的属性
? 关系的码,各实体码的组合
例,,讲授, 联系是一个三元联系,可以将它
转换为如下关系模式,其中课程号、职工号和
书号为关系的组合码,
讲授( 课程号,职工号,书号 )
An Introduction to Database System
E-R图向关系模型的转换(续)
⒍ 同一实体集的实体间的联系,即 自联系,也可
按上述 1:1,1:n和 m:n三种情况分别处理。
例,如果教师实体集内部存在领导与被领导的
1:n自联系,我们可以将该联系与教师实体合
并,这时主码职工号将多次出现,但作用不同,
可用不同的属性名加以区分,
教师:{ 职工号,姓名,性别,职称,系主任 }
An Introduction to Database System
E-R图向关系模型的转换(续)
⒎ 具有相同码的关系模式可合并。
? 目的:减少系统中的关系个数。
? 合并方法:将其中一个关系模式的全部属性
加入到另一个关系模式中,然后去掉其中的
同义属性(可能同名也可能不同名),并适
当调整属性的次序。
An Introduction to Database System
E-R图向关系模型的转换(续)
例,,拥有, 关系模式,
拥有( 学号,性别)
与学生关系模式,
学生( 学号,姓名,出生日期,所在系,年级,
班级号,平均成绩)
都以学号为码,可以将它们合并为一个关系模式,
学生( 学号,姓名,性别,出生日期,所在系,
年级,班级号,平均成绩)
An Introduction to Database System
E-R图向关系模型的转换(续)
实例
? 按照上述七条原则,学生管理子系统中的 18个实
体和联系可以转换为下列关系模型,
学生( 学号,姓名,性别,出生日期,所在系,
年级,班级号,平均成绩,档案号)
性别( 性别,宿舍楼)
宿舍( 宿舍编号,地址,性别,人数)
班级( 班级号,学生人数)
教师( 职工号,姓名,性别,职称,班级号,
是否为优秀班主任)
An Introduction to Database System
E-R图向关系模型的转换(续)
教学( 职工号,学号 )
课程( 课程号,课程名,学分,教室号)
选修( 学号,课程号,成绩)
教科书( 书号,书名,价钱)
教室( 教室编号,地址,容量)
讲授( 课程号,教师号,书号 )
档案材料( 档案号,…… )
An Introduction to Database System
E-R图向关系模型的转换(续)
? 该关系模型由 12个关系模式组成。
其中,
? 学生关系模式包含了, 拥有, 联系,,组成,
联系,,归档, 联系所对应的关系模式
? 教师关系模式包含了, 管理, 联系所对应的
关系模式;
? 宿舍关系模式包含了, 住宿, 联系所对应的
关系模式;
? 课程关系模式包含了, 开设, 联系所对应的
关系模式 。
An Introduction to Database System
6.4 逻辑结构设计
6.4.1 E-R图向关系模型的转换
6.4.2 向特定 DBMS规定的模型进行转换
6.4.3 数据模型的优化
6.4.4 设计用户子模式
An Introduction to Database System
6.4.2 向特定 DBMS规定的模型进行转换
? 一般的数据模型还需要向特定 DBMS规定
的模型进行转换。
? 转换的主要依据是所选用的 DBMS的功能
及限制。没有通用规则。
? 对于关系模型来说,这种转换通常都比
较简单。
An Introduction to Database System
6.4 逻辑结构设计
6.4.1 E-R图向关系模型的转换
6.4.2 向特定 DBMS规定的模型进行转换
6.4.3 数据模型的优化
6.4.4 设计用户子模式
An Introduction to Database System
6.4.3 数据模型的优化
? 数据库逻辑设计的结果不是唯一的。
? 得到初步数据模型后,还应该适当地修
改、调整数据模型的结构,以进一步提
高数据库应用系统的性能,这就是数据
模型的优化。
? 关系数据模型的优化通常以规范化理论
为指导。
An Introduction to Database System
数据模型的优化(续)
? 优化数据模型的方法
⒈ 确定数据依赖
? 按需求分析阶段所得到的语义,分别写出
每个关系模式内部各属性之间的数据依赖
以及不同关系模式属性之间数据依赖 。
An Introduction to Database System
数据模型的优化(续)
例,课程关系模式内部存在下列数据依赖,
课程号 → 课程名
课程号 → 学分
课程号 → 教室号
选修关系模式中存在下列数据依赖,
(学号,课程号) → 成绩
An Introduction to Database System
数据模型的优化(续)
学生关系模式中存在下列数据依赖,
学号 → 姓名
学号 → 性别
学号 → 出生日期
学号 → 所在系
学号 → 年级
学号 → 班级号
学号 → 平均成绩
学号 → 档案号
An Introduction to Database System
数据模型的优化(续)
学生关系模式的学号与选修关系模式的学号之
间存在数据依赖,
学生,学号 → 选修,学号
An Introduction to Database System
数据模型的优化(续)
⒉ 对于各个关系模式之间的数据依赖进行极小
化处理,消除冗余的联系。
An Introduction to Database System
数据模型的优化(续)
⒊ 按照数据依赖的理论对关系模式逐一进行分
析,考查是否存在部分函数依赖、传递函数
依赖、多值依赖等,确定各关系模式分别属
于第几范式。
例如经过分析可知,课程关系模式属于 BC范
式。
An Introduction to Database System
数据模型的优化(续)
⒋ 按照需求分析阶段得到的各种应用对数据处
理的要求,分析对于这样的应用环境这些模
式是否合适,确定是否要对它们进行合并或
分解。
An Introduction to Database System
数据模型的优化(续)
? 并不是规范化程度越高的关系就越优。
? 当一个应用的查询中经常涉及到两个或
多个关系模式的属性时,系统必须经常
地进行联接运算,而联系运算的代价是
相当高的,可以说关系模型低效的主要
原因就是做联接运算引起的,因此在这
种情况下,第二范式甚至第一范式也许
是最好的。
An Introduction to Database System
数据模型的优化(续)
? 非 BCNF的关系模式虽然从理论上分析会
存在不同程度的更新异常,但如果在实
际应用中对此关系模式只是查询,并不
执行更新操作,则就不会产生实际影响。
? 对于一个具体应用来说,到底规范化进
行到什么程度,需要权衡响应时间和潜
在问题两者的利弊才能决定。一般说来,
第三范式就足够了。
An Introduction to Database System
数据模型的优化(续)
例:在关系模式
学生成绩单 (学号,英语,数学,语文,平均成绩 )
中存在下列函数依赖,
学号 → 英语
学号 → 数学
学号 → 语文
学号 → 平均成绩
(英语,数学,语文 )→ 平均成绩
An Introduction to Database System
数据模型的优化(续)
显然有,
学号 → (英语,数学,语文 )
因此该关系模式中存在传递函数信赖,是
2NF关系。
虽然平均成绩可以由其他属性推算出来,但
如果应用中需要经常查询学生的平均成绩,
为提高效率,我们仍然可保留该冗余数据,
对关系模式不再做进一步分解。
An Introduction to Database System
数据模型的优化(续)
⒌ 按照需求分析阶段得到的各种应用对数据处
理的要求,对关系模式进行必要的分解或合
并,以提高数据操作的效率和存储空间的利
用率
? 常用分解方法
? 水平分解
? 垂直分解
An Introduction to Database System
数据模型的优化(续)
? 水平分解
? 什么是水平分解
? 把 (基本 )关系的元组分为若干子集合,
定义每个子集合为一个子关系, 以提
高系统的效率 。
An Introduction to Database System
数据模型的优化(续)
? 水平分解的适用范围
? 1,满足, 80/20原则, 的应用
? 80/20原则:一个大关系中,经常被使
用的数据只是关系的一部分,约 20%
? 把经常使用的数据分解出来, 形成一
个子关系, 可以减少查询的数据量 。
An Introduction to Database System
数据模型的优化(续)
? 水平分解的适用范围
? 2,并发事务经常存取不相交的数据
? 如果关系 R上具有 n个事务, 而且多
数事务存取的数据不相交, 则 R可
分解为少于或等于 n个子关系, 使
每个事务存取的数据对应一个关系 。
An Introduction to Database System
数据模型的优化(续)
? 水平分解
? 什么是水平分解
? 把 (基本 )关系的元组分为若干子集合,
定义每个子集合为一个子关系, 以提
高系统的效率 。
? 水平分解的适用范围
? 满足, 80/20原则, 的应用
? 并发事务经常存取不相交的数据
An Introduction to Database System
数据模型的优化(续)
? 满足, 80/20原则, 的应用
? 80/20原则:一个大关系中,经常被使
用的数据只是关系的一部分,约 20%
? 把经常使用的数据分解出来, 形成一
个子关系, 可以减少查询的数据量 。
? 并发事务经常存取不相交的数据
? 如果关系 R上具有 n个事务, 而且多数
事务存取的数据不相交, 则 R可分解为
少于或等于 n个子关系, 使每个事务存
取的数据对应一个关系 。
An Introduction to Database System
数据模型的优化(续)
? 垂直分解
? 什么是垂直分解
? 把关系模式 R的属性分解为若干子集合,
形成若干子关系模式 。
? 垂直分解的原则
? 经常在一起使用的属性从 R中分解出来
形成一个子关系模式 。
An Introduction to Database System
数据模型的优化(续)
? 垂直分解的优点
? 可以提高某些事务的效率
? 垂直分解的缺点
? 可能使另一些事务不得不执行连接操
作, 从而降低了效率 。
An Introduction to Database System
数据模型的优化(续)
? 垂直分解的适用范围
? 取决于分解后 R上的所有事务的总效率是
否得到了提高 。
? 进行垂直分解的方法
? 简单情况:直观分解
? 复杂情况:用第五章中的模式分解算法
? 垂直分解必须不损失关系模式的语义 (保
持无损连接性和保持函数依赖 )。
An Introduction to Database System
6.4 逻辑结构设计
6.4.1 E-R图向关系模型的转换
6.4.2 向特定 DBMS规定的模型进行转换
6.4.3 数据模型的优化
6.4.4 设计用户子模式
An Introduction to Database System
6.4.4 设计用户子模式
? 定义数据库模式主要是从系统的时间效率、空
间效率、易维护等角度出发。
? 定义用户外模式时应该更注重考虑用户的习惯
与方便。包括三个方面,
An Introduction to Database System
设计用户子模式(续)
(1) 使用更符合用户习惯的别名
? 合并各分 E-R图曾做了消除命名冲突的工作,
以使数据库系统中同一关系和属性具有唯一
的名字。这在设计数据库整体结构时是非常
必要的。
? 但对于某些局部应用,由于改用了不符合用
户习惯的属性名,可能会使他们感到不方便,
An Introduction to Database System
设计用户子模式(续)
(1) 使用更符合用户习惯的别名 (续 )
? 因此在设计用户的子模式时可以重新定义某
些属性名,使其与用户习惯一致。
? 当然,为了应用的规范化,我们也不应该一
味地迁就用户。
例:负责学籍管理的用户习惯于称教师模式的
职工号为教师编号。因此可以定义视图,在
视图中职工号重定义为教师编号
An Introduction to Database System
设计用户子模式(续)
(2) 针对不同级别的用户定义不同的外模式,以
满足系统对安全性的要求。
An Introduction to Database System
设计用户子模式(续)
例,
教师关系模式中包括职工号、姓名、性别、出生日
期、婚姻状况、学历、学位、政治面貌、职称、职
务、工资、工龄、教学效果等属性。
学籍管理应用 只能查询教师的职工号、姓名、
性别、职称数据;
课程管理应用 只能查询教师的职工号、姓名、
性别、学历、学位、职称、教学效果数据;
教师管理应用 则可以查询教师的全部数据。
An Introduction to Database System
设计用户子模式(续)
定义两个外模式,
教师 _学籍管理 (职工号,姓名,性别,职称 )
教师 _课程管理 (工号,姓名,性别,学历,
学位,职称,教学效果 )
授权学籍管理应用只能访问教师 _学籍管理视图
授权课程管理应用只能访问教师 _课程管理视图
授权教师管理应用能访问教师表
这样就可以防止用户非法访问本来不允许他们查询
的数据,保证了系统的安全性。
An Introduction to Database System
设计用户子模式(续)
(3) 简化用户对系统的使用
? 如果某些局部应用中经常要使用某些很复杂
的查询,为了方便用户,可以将这些复杂查
询定义为视图。
An Introduction to Database System
逻辑结构设计小结
? 任务
? 将概念结构转化为具体的数据模型
? 逻辑结构设计的步骤
? 将概念结构转化为一般的关系、网状、层次模
型
? 将转化来的关系、网状、层次模型向特定
DBMS支持下的数据模型转换
? 对数据模型进行优化
? 设计用户子模式
An Introduction to Database System
逻辑结构设计小结
? E-R图向关系模型的转换内容
? 将 E-R图转换为关系模型:将实体、实体的
属性和实体之间的联系转化为关系模式。
An Introduction to Database System
逻辑结构设计小结
? E-R图向关系模型的转换原则
⒈ 一个 实体型 转换为一个关系模式。
⒉ 一个 m:n联系 转换为一个关系模式。
⒊ 一个 1:n联系 可以转换为一个独立的关系模式,
也可以与 n端对应的关系模式合并。
⒋ 一个 1:1联系 可以转换为一个独立的关系模式,
也可以与任意一端对应的关系模式合并。
An Introduction to Database System
逻辑结构设计小结
? E-R图向关系模型的转换原则
⒌ 三个或三个以上实体间的一个 多元联系 转换为
一个关系模式。
⒍ 同一实体集的实体间的联系,即 自联系,也可
按上述 1:1,1:n和 m:n三种情况分别处理。
⒎ 具有 相同码 的关系模式可合并。
An Introduction to Database System
逻辑结构设计小结
? 优化数据模型的方法
⒈ 确定数据依赖
⒉ 对于各个关系模式之间的数据依赖进行极小
化处理,消除冗余的联系。
⒊ 确定各关系模式分别属于第几范式。
⒋ 分析对于应用环境这些模式是否合适,确定
是否要对它们进行合并或分解。
⒌ 对关系模式进行必要的分解或合并
An Introduction to Database System
逻辑结构设计小结
? 设计用户子模式
1,使用更符合用户习惯的别名
2,针对不同级别的用户定义不同的外模式,以
满足系统对安全性的要求。
3,简化用户对系统的使用
An Introduction to Database System
下课了。。。
休息一会儿。。。
中国人民大学信息学院计算机系
数据库系统概论
An Introduction to Database System
第六章 数据库设计 (续 -2)
An Introduction to Database System
第六章 数据库设计
6.1 数据库设计概述
6.2 需求分析
6.3 概念结构设计
6.4 逻辑结构设计
6.5 数据库的物理设计
6.6 数据库实施
6.7 数据库运行与维护
6.8 小结
An Introduction to Database System
6.4 逻辑结构设计
? 逻辑结构设计的任务
? 概念结构是各种数据模型的共同基础
? 为了能够用某一 DBMS实现用户需求,还必
须将概念结构进一步转化为相应的数据模型,
这正是数据库逻辑结构设计所要完成的任务。
An Introduction to Database System
6.4 逻辑结构设计
? 逻辑结构设计的步骤
? 将概念结构转化为一般的关系, 网状, 层次
模型
? 将转化来的关系, 网状, 层次模型向特定
DBMS支持下的数据模型转换
? 对数据模型进行优化
An Introduction to Database System
逻辑结构设计
转化为
一般数
据模型
转化为特
定 DBMS
支持下的
据模型
优化模
型 概念结
构设计
数据库
物理设计
基本 E-R图
转换规
则
特定
DBMS的
特点与限
制
优化方
法如规
范化理
论
逻辑
模型
An Introduction to Database System
6.4 逻辑结构设计
6.4.1 E-R图向关系模型的转换
6.4.2 向特定 DBMS规定的模型进行转换
6.4.3 数据模型的优化
6.4.4 设计用户子模式
An Introduction to Database System
6.4.1 E-R图向关系模型的转换
? 转换内容
? 转换原则
An Introduction to Database System
E-R图向关系模型的转换(续)
? 转换内容
? E-R图由实体、实体的属性和实体之间的联
系三个要素组成
? 关系模型的逻辑结构是一组关系模式的集合
? 将 E-R图转换为关系模型:将实体、实体的
属性和实体之间的联系转化为关系模式。
An Introduction to Database System
E-R图向关系模型的转换(续)
? 转换原则
⒈ 一个 实体型 转换为一个关系模式。
? 关系的属性,实体型的属性
? 关系的码,实体型的码
例,学生实体可以转换为如下关系模式,
学生( 学号,姓名,出生日期,所在系,
年级,平均成绩)
性别、宿舍、班级、档案材料、教师、课程、教室、
教科书都分别转换为一个关系模式。
An Introduction to Database System
学生
学号 出生 日期 年级 所在系 平均 成绩 姓名
An Introduction to Database System
E-R图向关系模型的转换(续)
⒉ 一个 m:n联系 转换为一个关系模式。
? 关系的属性,与该联系相连的各实体的码以
及联系本身的属性
? 关系的码,各实体码的组合
例,,选修, 联系是一个 m:n联系,可以将它
转换为如下关系模式,其中学号与课程号为关
系的组合码,
选修( 学号, 课程号,成绩)
An Introduction to Database System
E-R图向关系模型的转换(续)
⒊ 一个 1:n联系 可以转换为一个独立的关系模式,
也可以与 n端对应的关系模式合并。
? 1) 转换为一个独立的关系模式
? 关系的属性,与该联系相连的各实体的码
以及联系本身的属性
? 关系的码, n端实体的码
An Introduction to Database System
E-R图向关系模型的转换(续)
⒊ 一个 1:n联系 可以转换为一个独立的关系模式,
也可以与 n端对应的关系模式合并。
? 2) 与 n端对应的关系模式合并
? 合并后关系的属性,在 n端关系中加入 1端
关系的码和联系本身的属性
? 合并后关系的码,不变
? 可以减少系统中的关系个数,一般情况下更
倾向于采用这种方法
An Introduction to Database System
E-R图向关系模型的转换(续)
例,,组成, 联系为 1:n联系。
将其转换为关系模式的两种方法,
1)使其成为一个独立的关系模式,
组成( 学号,班级号)
2)将其学生关系模式合并,
学生( 学号,姓名,出生日期,所在系,
年级,班级号,平均成绩)
An Introduction to Database System
E-R图向关系模型的转换(续)
⒋ 一个 1:1联系可以转换为一个独立的关系模式,
也可以与任意一端对应的关系模式合并。
? 1) 转换为一个独立的关系模式
? 关系的属性,与该联系相连的各实体的码
以及联系本身的属性
? 关系的候选码,每个实体的码均是该关系
的候选码
An Introduction to Database System
E-R图向关系模型的转换(续)
⒋ 一个 1:1联系可以转换为一个独立的关系模式,
也可以与任意一端对应的关系模式合并。
? 2) 与某一端对应的关系模式合并
? 合并后关系的属性,加入对应关系的码和
联系本身的属性
? 合并后关系的码,不变
An Introduction to Database System
E-R图向关系模型的转换(续)
例,,管理, 联系为 1:1联系,可以有三种转换方法,
( 1)转换为一个独立的关系模式,
管理( 职工号,班级号)
或 管理(职工号,班级号 )
( 2), 管理, 联系与班级关系模式合并,则只需在班
级关系中加入教师关系的码,即职工号,
班级:( 班级号,学生人数,职工号 )
( 3), 管理, 联系与教师关系模式合并,则只需在教
师关系中加入班级关系的码,即班级号,
教师:( 职工号,姓名,性别,职称,班级号,
是否为优秀班主任)
An Introduction to Database System
E-R图向关系模型的转换(续)
注意,
? 从理论上讲,1:1联系可以与任意一端对应的关系模
式合并。
? 但在一些情况下,与不同的关系模式合并效率会大
不一样。因此究竟应该与哪端的关系模式合并需要
依应用的具体情况而定。
? 由于连接操作是最费时的操作,所以一般应以尽量
减少连接操作为目标。
例如,如果经常要查询某个班级的班主任姓名,则
将管理联系与教师关系合并更好些。
An Introduction to Database System
E-R图向关系模型的转换(续)
⒌ 三个或三个以上实体间的一个 多元联系 转换为
一个关系模式。
? 关系的属性,与该多元联系相连的各实体的
码以及联系本身的属性
? 关系的码,各实体码的组合
例,,讲授, 联系是一个三元联系,可以将它
转换为如下关系模式,其中课程号、职工号和
书号为关系的组合码,
讲授( 课程号,职工号,书号 )
An Introduction to Database System
E-R图向关系模型的转换(续)
⒍ 同一实体集的实体间的联系,即 自联系,也可
按上述 1:1,1:n和 m:n三种情况分别处理。
例,如果教师实体集内部存在领导与被领导的
1:n自联系,我们可以将该联系与教师实体合
并,这时主码职工号将多次出现,但作用不同,
可用不同的属性名加以区分,
教师:{ 职工号,姓名,性别,职称,系主任 }
An Introduction to Database System
E-R图向关系模型的转换(续)
⒎ 具有相同码的关系模式可合并。
? 目的:减少系统中的关系个数。
? 合并方法:将其中一个关系模式的全部属性
加入到另一个关系模式中,然后去掉其中的
同义属性(可能同名也可能不同名),并适
当调整属性的次序。
An Introduction to Database System
E-R图向关系模型的转换(续)
例,,拥有, 关系模式,
拥有( 学号,性别)
与学生关系模式,
学生( 学号,姓名,出生日期,所在系,年级,
班级号,平均成绩)
都以学号为码,可以将它们合并为一个关系模式,
学生( 学号,姓名,性别,出生日期,所在系,
年级,班级号,平均成绩)
An Introduction to Database System
E-R图向关系模型的转换(续)
实例
? 按照上述七条原则,学生管理子系统中的 18个实
体和联系可以转换为下列关系模型,
学生( 学号,姓名,性别,出生日期,所在系,
年级,班级号,平均成绩,档案号)
性别( 性别,宿舍楼)
宿舍( 宿舍编号,地址,性别,人数)
班级( 班级号,学生人数)
教师( 职工号,姓名,性别,职称,班级号,
是否为优秀班主任)
An Introduction to Database System
E-R图向关系模型的转换(续)
教学( 职工号,学号 )
课程( 课程号,课程名,学分,教室号)
选修( 学号,课程号,成绩)
教科书( 书号,书名,价钱)
教室( 教室编号,地址,容量)
讲授( 课程号,教师号,书号 )
档案材料( 档案号,…… )
An Introduction to Database System
E-R图向关系模型的转换(续)
? 该关系模型由 12个关系模式组成。
其中,
? 学生关系模式包含了, 拥有, 联系,,组成,
联系,,归档, 联系所对应的关系模式
? 教师关系模式包含了, 管理, 联系所对应的
关系模式;
? 宿舍关系模式包含了, 住宿, 联系所对应的
关系模式;
? 课程关系模式包含了, 开设, 联系所对应的
关系模式 。
An Introduction to Database System
6.4 逻辑结构设计
6.4.1 E-R图向关系模型的转换
6.4.2 向特定 DBMS规定的模型进行转换
6.4.3 数据模型的优化
6.4.4 设计用户子模式
An Introduction to Database System
6.4.2 向特定 DBMS规定的模型进行转换
? 一般的数据模型还需要向特定 DBMS规定
的模型进行转换。
? 转换的主要依据是所选用的 DBMS的功能
及限制。没有通用规则。
? 对于关系模型来说,这种转换通常都比
较简单。
An Introduction to Database System
6.4 逻辑结构设计
6.4.1 E-R图向关系模型的转换
6.4.2 向特定 DBMS规定的模型进行转换
6.4.3 数据模型的优化
6.4.4 设计用户子模式
An Introduction to Database System
6.4.3 数据模型的优化
? 数据库逻辑设计的结果不是唯一的。
? 得到初步数据模型后,还应该适当地修
改、调整数据模型的结构,以进一步提
高数据库应用系统的性能,这就是数据
模型的优化。
? 关系数据模型的优化通常以规范化理论
为指导。
An Introduction to Database System
数据模型的优化(续)
? 优化数据模型的方法
⒈ 确定数据依赖
? 按需求分析阶段所得到的语义,分别写出
每个关系模式内部各属性之间的数据依赖
以及不同关系模式属性之间数据依赖 。
An Introduction to Database System
数据模型的优化(续)
例,课程关系模式内部存在下列数据依赖,
课程号 → 课程名
课程号 → 学分
课程号 → 教室号
选修关系模式中存在下列数据依赖,
(学号,课程号) → 成绩
An Introduction to Database System
数据模型的优化(续)
学生关系模式中存在下列数据依赖,
学号 → 姓名
学号 → 性别
学号 → 出生日期
学号 → 所在系
学号 → 年级
学号 → 班级号
学号 → 平均成绩
学号 → 档案号
An Introduction to Database System
数据模型的优化(续)
学生关系模式的学号与选修关系模式的学号之
间存在数据依赖,
学生,学号 → 选修,学号
An Introduction to Database System
数据模型的优化(续)
⒉ 对于各个关系模式之间的数据依赖进行极小
化处理,消除冗余的联系。
An Introduction to Database System
数据模型的优化(续)
⒊ 按照数据依赖的理论对关系模式逐一进行分
析,考查是否存在部分函数依赖、传递函数
依赖、多值依赖等,确定各关系模式分别属
于第几范式。
例如经过分析可知,课程关系模式属于 BC范
式。
An Introduction to Database System
数据模型的优化(续)
⒋ 按照需求分析阶段得到的各种应用对数据处
理的要求,分析对于这样的应用环境这些模
式是否合适,确定是否要对它们进行合并或
分解。
An Introduction to Database System
数据模型的优化(续)
? 并不是规范化程度越高的关系就越优。
? 当一个应用的查询中经常涉及到两个或
多个关系模式的属性时,系统必须经常
地进行联接运算,而联系运算的代价是
相当高的,可以说关系模型低效的主要
原因就是做联接运算引起的,因此在这
种情况下,第二范式甚至第一范式也许
是最好的。
An Introduction to Database System
数据模型的优化(续)
? 非 BCNF的关系模式虽然从理论上分析会
存在不同程度的更新异常,但如果在实
际应用中对此关系模式只是查询,并不
执行更新操作,则就不会产生实际影响。
? 对于一个具体应用来说,到底规范化进
行到什么程度,需要权衡响应时间和潜
在问题两者的利弊才能决定。一般说来,
第三范式就足够了。
An Introduction to Database System
数据模型的优化(续)
例:在关系模式
学生成绩单 (学号,英语,数学,语文,平均成绩 )
中存在下列函数依赖,
学号 → 英语
学号 → 数学
学号 → 语文
学号 → 平均成绩
(英语,数学,语文 )→ 平均成绩
An Introduction to Database System
数据模型的优化(续)
显然有,
学号 → (英语,数学,语文 )
因此该关系模式中存在传递函数信赖,是
2NF关系。
虽然平均成绩可以由其他属性推算出来,但
如果应用中需要经常查询学生的平均成绩,
为提高效率,我们仍然可保留该冗余数据,
对关系模式不再做进一步分解。
An Introduction to Database System
数据模型的优化(续)
⒌ 按照需求分析阶段得到的各种应用对数据处
理的要求,对关系模式进行必要的分解或合
并,以提高数据操作的效率和存储空间的利
用率
? 常用分解方法
? 水平分解
? 垂直分解
An Introduction to Database System
数据模型的优化(续)
? 水平分解
? 什么是水平分解
? 把 (基本 )关系的元组分为若干子集合,
定义每个子集合为一个子关系, 以提
高系统的效率 。
An Introduction to Database System
数据模型的优化(续)
? 水平分解的适用范围
? 1,满足, 80/20原则, 的应用
? 80/20原则:一个大关系中,经常被使
用的数据只是关系的一部分,约 20%
? 把经常使用的数据分解出来, 形成一
个子关系, 可以减少查询的数据量 。
An Introduction to Database System
数据模型的优化(续)
? 水平分解的适用范围
? 2,并发事务经常存取不相交的数据
? 如果关系 R上具有 n个事务, 而且多
数事务存取的数据不相交, 则 R可
分解为少于或等于 n个子关系, 使
每个事务存取的数据对应一个关系 。
An Introduction to Database System
数据模型的优化(续)
? 水平分解
? 什么是水平分解
? 把 (基本 )关系的元组分为若干子集合,
定义每个子集合为一个子关系, 以提
高系统的效率 。
? 水平分解的适用范围
? 满足, 80/20原则, 的应用
? 并发事务经常存取不相交的数据
An Introduction to Database System
数据模型的优化(续)
? 满足, 80/20原则, 的应用
? 80/20原则:一个大关系中,经常被使
用的数据只是关系的一部分,约 20%
? 把经常使用的数据分解出来, 形成一
个子关系, 可以减少查询的数据量 。
? 并发事务经常存取不相交的数据
? 如果关系 R上具有 n个事务, 而且多数
事务存取的数据不相交, 则 R可分解为
少于或等于 n个子关系, 使每个事务存
取的数据对应一个关系 。
An Introduction to Database System
数据模型的优化(续)
? 垂直分解
? 什么是垂直分解
? 把关系模式 R的属性分解为若干子集合,
形成若干子关系模式 。
? 垂直分解的原则
? 经常在一起使用的属性从 R中分解出来
形成一个子关系模式 。
An Introduction to Database System
数据模型的优化(续)
? 垂直分解的优点
? 可以提高某些事务的效率
? 垂直分解的缺点
? 可能使另一些事务不得不执行连接操
作, 从而降低了效率 。
An Introduction to Database System
数据模型的优化(续)
? 垂直分解的适用范围
? 取决于分解后 R上的所有事务的总效率是
否得到了提高 。
? 进行垂直分解的方法
? 简单情况:直观分解
? 复杂情况:用第五章中的模式分解算法
? 垂直分解必须不损失关系模式的语义 (保
持无损连接性和保持函数依赖 )。
An Introduction to Database System
6.4 逻辑结构设计
6.4.1 E-R图向关系模型的转换
6.4.2 向特定 DBMS规定的模型进行转换
6.4.3 数据模型的优化
6.4.4 设计用户子模式
An Introduction to Database System
6.4.4 设计用户子模式
? 定义数据库模式主要是从系统的时间效率、空
间效率、易维护等角度出发。
? 定义用户外模式时应该更注重考虑用户的习惯
与方便。包括三个方面,
An Introduction to Database System
设计用户子模式(续)
(1) 使用更符合用户习惯的别名
? 合并各分 E-R图曾做了消除命名冲突的工作,
以使数据库系统中同一关系和属性具有唯一
的名字。这在设计数据库整体结构时是非常
必要的。
? 但对于某些局部应用,由于改用了不符合用
户习惯的属性名,可能会使他们感到不方便,
An Introduction to Database System
设计用户子模式(续)
(1) 使用更符合用户习惯的别名 (续 )
? 因此在设计用户的子模式时可以重新定义某
些属性名,使其与用户习惯一致。
? 当然,为了应用的规范化,我们也不应该一
味地迁就用户。
例:负责学籍管理的用户习惯于称教师模式的
职工号为教师编号。因此可以定义视图,在
视图中职工号重定义为教师编号
An Introduction to Database System
设计用户子模式(续)
(2) 针对不同级别的用户定义不同的外模式,以
满足系统对安全性的要求。
An Introduction to Database System
设计用户子模式(续)
例,
教师关系模式中包括职工号、姓名、性别、出生日
期、婚姻状况、学历、学位、政治面貌、职称、职
务、工资、工龄、教学效果等属性。
学籍管理应用 只能查询教师的职工号、姓名、
性别、职称数据;
课程管理应用 只能查询教师的职工号、姓名、
性别、学历、学位、职称、教学效果数据;
教师管理应用 则可以查询教师的全部数据。
An Introduction to Database System
设计用户子模式(续)
定义两个外模式,
教师 _学籍管理 (职工号,姓名,性别,职称 )
教师 _课程管理 (工号,姓名,性别,学历,
学位,职称,教学效果 )
授权学籍管理应用只能访问教师 _学籍管理视图
授权课程管理应用只能访问教师 _课程管理视图
授权教师管理应用能访问教师表
这样就可以防止用户非法访问本来不允许他们查询
的数据,保证了系统的安全性。
An Introduction to Database System
设计用户子模式(续)
(3) 简化用户对系统的使用
? 如果某些局部应用中经常要使用某些很复杂
的查询,为了方便用户,可以将这些复杂查
询定义为视图。
An Introduction to Database System
逻辑结构设计小结
? 任务
? 将概念结构转化为具体的数据模型
? 逻辑结构设计的步骤
? 将概念结构转化为一般的关系、网状、层次模
型
? 将转化来的关系、网状、层次模型向特定
DBMS支持下的数据模型转换
? 对数据模型进行优化
? 设计用户子模式
An Introduction to Database System
逻辑结构设计小结
? E-R图向关系模型的转换内容
? 将 E-R图转换为关系模型:将实体、实体的
属性和实体之间的联系转化为关系模式。
An Introduction to Database System
逻辑结构设计小结
? E-R图向关系模型的转换原则
⒈ 一个 实体型 转换为一个关系模式。
⒉ 一个 m:n联系 转换为一个关系模式。
⒊ 一个 1:n联系 可以转换为一个独立的关系模式,
也可以与 n端对应的关系模式合并。
⒋ 一个 1:1联系 可以转换为一个独立的关系模式,
也可以与任意一端对应的关系模式合并。
An Introduction to Database System
逻辑结构设计小结
? E-R图向关系模型的转换原则
⒌ 三个或三个以上实体间的一个 多元联系 转换为
一个关系模式。
⒍ 同一实体集的实体间的联系,即 自联系,也可
按上述 1:1,1:n和 m:n三种情况分别处理。
⒎ 具有 相同码 的关系模式可合并。
An Introduction to Database System
逻辑结构设计小结
? 优化数据模型的方法
⒈ 确定数据依赖
⒉ 对于各个关系模式之间的数据依赖进行极小
化处理,消除冗余的联系。
⒊ 确定各关系模式分别属于第几范式。
⒋ 分析对于应用环境这些模式是否合适,确定
是否要对它们进行合并或分解。
⒌ 对关系模式进行必要的分解或合并
An Introduction to Database System
逻辑结构设计小结
? 设计用户子模式
1,使用更符合用户习惯的别名
2,针对不同级别的用户定义不同的外模式,以
满足系统对安全性的要求。
3,简化用户对系统的使用
An Introduction to Database System
下课了。。。
休息一会儿。。。