计算机科学与技术学院第六章 数据库设计第六章 数据库设计
6.1 数据库设计概述
6.2 需求分析
6.3 概念结构设计
6.4 逻辑结构设计
6.5 数据库的物理设计
6.6 数据库实施
6.7 数据库运行与维护
6.8 小结
6.1 数据库设计概述
6.1.1 数据库和信息系统
6.1.2 数据库设计的特点
6.1.3 数据库设计方法简述
6.1.4 数据库设计的基本步骤数据库设计概述(续)
什么是数据库设计
– 数据库设计是指对于一个给定的应用环境,
构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)
– 在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。
6.1.1 数据库和信息系统
数据库是信息系统的核心和基础
– 把信息系统中大量的数据按一定的模型组织起来
– 提供存储、维护、检索数据的功能
– 使信息系统可以方便、及时、准确地从数据库中获得所需的信息
数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在
数据库设计是信息系统开发和建设的重要组成部分数据库设计人员应该具备的技术和知识
数据库的基本知识和数据库设计技术
计算机科学的基础知识和程序设计的方法和技巧
软件工程的原理和方法
应用领域的知识
6.1 数据库设计概述
6.1.1 数据库和信息系统
6.1.2 数据库设计的特点
6.1.3 数据库设计方法简述
6.1.4 数据库设计的基本步骤
6.1.2 数据库设计的特点
数据库建设是硬件,软件 和干件的结合
– 三分技术,七分管理,十二分基础数据
– 技术与管理的界面称之为,干件,
数据库设计应该与应用系统设计相结合
– 结构(数据)设计:设计数据库框架或数据库结构
– 行为(处理)设计:设计应用程序、事务处理等数据库设计的特点(续)
结构和行为分离的设计
– 传统的软件工程忽视对应用中数据语义的分析和抽象,只要有可能就尽量推迟数据结构设计的决策
– 早期的数据库设计致力于数据模型和建模方法研究,忽视了对行为的设计数据库设计的特点(续)
现实世界概念模型设计子模式设计物理数据库设计逻辑数据库设计建立数据库数据分析 功能分析功能模型 功能说明事务设计程序说明应用程序设计程序编码调试
6.1 数据库设计概述
6.1.1 数据库和信息系统
6.1.2 数据库设计的特点
6.1.3 数据库设计方法简述
6.1.4 数据库设计的基本步骤
6.1.3 数据库设计方法简述
手工试凑法
– 设计质量与设计人员的经验和水平有直接关系
– 缺乏科学理论和工程方法的支持,工程的质量难以保证
– 数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护代价数据库设计方法简述(续)
规范设计法
– 手工设计方法
– 基本思想
过程迭代和逐步求精数据库设计方法简述(续)
规范设计法 (续 )
– 典型方法
新奥尔良( New Orleans)方法
– 将数据库设计分为四个阶段
S.B.Yao方法
– 将数据库设计分为五个步骤
I.R.Palmer方法
– 把数据库设计当成一步接一步的过程数据库设计方法简述(续)
计算机辅助设计
– ORACLE Designer 2000
– SYBASE PowerDesigner
6.1 数据库设计概述
6.1.1 数据库和信息系统
6.1.2 数据库设计的特点
6.1.3 数据库设计方法简述
6.1.4 数据库设计的基本步骤
6.1.4 数据库设计的基本步骤一、数据库设计的准备工作选定参加设计的人员
1,数据库分析设计人员
– 数据库设计的核心人员
– 自始至终参与数据库设计
– 其水平决定了数据库系统的质量
6.1.4 数据库设计的基本步骤
2,用户
– 在数据库设计中也是举足轻重的
– 主要参加需求分析和数据库的运行维护
– 用户积极参与带来的好处
加速数据库设计
提高数据库设计的质量数据库设计的基本步骤(续)
3,程序员
– 在系统实施阶段参与进来,负责编制程序
4,操作员
– 在系统实施阶段参与进来,准备软硬件环境数据库设计的基本步骤(续)
二、数据库设计的过程 (六个阶段 )
⒈需求分析阶段
– 准确了解与分析用户需求(包括数据与处理)
– 是整个设计过程的基础,是最困难、最耗费时间的一步数据库设计的基本步骤(续)
⒉概念结构设计阶段
– 是整个数据库设计的关键
– 通过对用户需求进行综合、归纳与抽象,形成一个独立于具体 DBMS的概念模型数据库设计的基本步骤(续)
⒊ 逻辑结构设计阶段
– 将概念结构转换为某个 DBMS所支持的数据模型
– 对其进行优化数据库设计的基本步骤(续)
⒋ 数据库物理设计阶段
– 为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)
数据库设计的基本步骤(续)
⒌ 数据库实施阶段
– 运用 DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果
建立数据库
编制与调试应用程序
组织数据入库
并进行试运行数据库设计的基本步骤(续)
⒍ 数据库运行和维护阶段
– 数据库应用系统经过试运行后即可投入正式运行。
– 在数据库系统运行过程中必须不断地对其进行评价、调整与修改。
数据库设计的基本步骤(续)
设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。
P206图 6.2
设计特点
在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来
将这两个方面的需求分析、抽象、设计、
实现在各个阶段同时进行,相互参照,
相互补充,以完善两方面的设计
设计过程各个阶段的设计描述,P208图
6.3
IPO表 ……
输入:
输出:
处理:
Creat……
Load……
Main( )
……
if……
then
……
end
分区 1
分区 2
……
概念结构设计逻辑结构设计物理设计设计阶段 设 计 描 述数 据 处 理需求分 析数据字典,全系统中数据项,
数据流,数据存储的描述数据流图和判定表 ( 判定树 ),数据字典中处理过程的描述概念模型 ( E-R图 )
数据字典系统说明书包括:
① 新系统要求,
方案和概图
② 反映新系统信息流的数据流图某种数据模型关系 非关系系统结构图
( 模块结构 )
存储安排方法选择存取路径建立模块设计
IPO表实施阶段编写模式装入数据数据库试运行程序编码,
编译联结,
测试运行,
维护 性能监测,转储 /恢复数据库重组和重构新旧系统转换,运行,维护 ( 修正性,
适应性,改善性维护 )
数据库设计的基本步骤(续)
数据库各级模式的形成过程 (P209图 6.4)
– 需求分析阶段
综合各个用户的应用需求
– 概念设计阶段
形成独立于机器特点,独立于各个
DBMS产品的概念模式 (E-R图 )
数据库设计的基本步骤(续)
– 逻辑设计阶段
首先将 E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式
然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图 (View),形成数据的外模式数据库设计的基本步骤(续)
– 物理设计阶段
根据 DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式第六章 数据库设计
6.1 数据库设计概述
6.2 需求分析
6.3 概念结构设计
6.4 逻辑结构设计
6.5 数据库的物理设计
6.6 数据库实施
6.7 数据库运行与维护
6.8 小结
6.2 需求分析
6.2.1 需求分析的任务
6.2.2 需求分析的方法
6.2.3 数据字典需求分析(续)
需求分析就是分析用户的需要与要求
– 需求分析是设计数据库的起点
– 需求分析的结果是否准确地反映了用户的实际要求,将直接影响到后面各个阶段的设计,
并影响到设计结果是否合理和实用
6.2 需求分析
6.2.1 需求分析的任务
6.2.2 需求分析的方法
6.2.3 数据字典
6.2.1 需求分析的任务一、需求分析的任务二、需求分析的重点三、需求分析的难点一、需求分析的任务
通过详细调查现实世界要处理的对象
(组织、部门、企业等),充分 了解原系统 (手工系统或计算机系统) 工作概况,明确用户的各种需求
在此基础上 确定新系统的功能 。新系统必须充分考虑今后可能的扩充和改变,
不能仅仅按当前应用需求来设计数据库二、需求分析的重点
需求分析的重点是调查、收集与分析用户在数据管理中的 信息要求、处理要求、安全性与完整性要求 。
信息要求
– 用户需要从数据库中获得信息的内容与性质
– 由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据需求分析的重点(续)
处理要求
– 对处理功能的要求
– 对处理的响应时间的要求
– 对处理方式的要求 (批处理 / 联机处理 )
新系统的功能必须能够满足用户的信息要求、
处理要求、安全性与完整性要求。
三、需求分析的难点
确定用户最终需求的难点
– 用户 缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。
– 设计人员 缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。
– 新 的硬件、软件 技术的出现 也会使用户需求发生变化。
需求分析的难点 (续 )
解决方法
– 设计人员必须采用有效的方法,与用户不断深入 地进行 交流,才能逐步得以确定用户的实际需求
6.2 需求分析
6.2.1 需求分析的任务
6.2.2 需求分析的方法
6.2.3 数据字典
6.2.2 需求分析的方法
调查清楚用户的实际需求并进行初步分析
与用户达成共识
进一步分析与表达这些需求一,调查与初步分析用户需求
⑴ 调查组织机构情况
– 组织部门的组成情况
– 各部门的职责等调查与初步分析用户需求(续)
⑵ 调查各部门的业务活动情况。调查重点之一。
– 各个部门输入和使用什么数据
– 如何加工处理这些数据
– 输出什么信息
– 输出到什么部门
– 输出结果的格式是什么调查与初步分析用户需求(续)
⑶ 在熟悉业务活动的基础上,协助用户明确对新系统的各种要求。调查重点之二。
– 信息要求
– 处理要求
– 完全性与完整性要求调查与初步分析用户需求(续)
⑷ 对前面调查的结果进行初步分析
– 确定新系统的边界
确定哪些功能由计算机完成或将来准备让计算机完成
确定哪些活动由人工完成由计算机完成的功能就是新系统应该实现的功能。
二、常用调查方法
做需求调查时,往往需要同时采用多种方法
– 无论使用何种调查方法,都必须有用户的积极参与和配合
– 设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果共同承担责任常用调查方法(续)
常用调查方法
⑴跟班作业
– 通过亲身参加业务工作了解业务活动的情况
– 能比较准确地理解用户的需求,但比较耗时
⑵开调查会
– 通过与用户座谈来了解业务活动情况及用户需求
⑶请专人介绍常用调查方法(续)
⑷ 询问
– 对某些调查中的问题,可以找专人询问
⑸设计调查表请用户填写
– 如果调查表设计合理,则很有效,且易于为用户接受
⑹查阅记录
– 查阅与原系统有关的数据记录三、进一步分析和表达用户需求
分析和表达用户的需求 的常用方法
– 自顶向下的结构化分析方法( Structured
Analysis,简称 SA方法)
SA方法从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并用数据流图和数据字典描述系统。
进一步分析和表达用户需求(续)
1.首先把任何一个系统都抽象为:
数据流数据流数据存储 信息要求数据来源处理 数据输出 处理要求进一步分析和表达用户需求(续)
2.分解处理功能和数据
( 1)分解处理功能
将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止。
( 2)分解数据
在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图
数据流图表达了数据和处理过程的关系进一步分析和表达用户需求(续)
( 3)表达方法
处理过程:用判定表或判定树来描述
数据:用数据字典来描述进一步分析和表达用户需求(续)
3.将分析结果再次提交给用户,征得用户的认可四、需求分析小结
P211图 6.6
需求分析小结(续)
实例:假设我们要开发一个学校管理系统。
1.经过可行性分析和初步需求调查,抽象出该系统最高层数据流图,该系统由教师管理子系统、学生管理子系统、后勤管理子系统组成,每个子系统分别配备一个开发小组。
2.进一步细化各个子系统。
其中学生管理子系统开发小组通过进行进一步的需求调查,
明确了该子系统的主要功能是进行学籍管理和课程管理,
包括学生报到、入学、毕业的管理,学生上课情况的管理。
通过详细的信息流程分析和数据收集后,他们生成了该子系统的数据流图。
6.2 需求分析
6.2.1 需求分析的任务
6.2.2 需求分析的方法
6.2.3 数据字典
6.2.3 数据字典一、数据字典的用途二、数据字典的内容一、数据字典的用途
数据字典是各类数据描述的集合
数据字典是进行详细的数据收集和数据分析所获得的主要结果
数据字典在数据库设计中占有很重要的地位二、数据字典的内容
数据字典的内容
– 数据项
– 数据结构
– 数据流
– 数据存储
– 处理过程
数据项是数据的最小组成单位
若干个数据项可以组成一个数据结构
数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。
⒈ 数据项
数据项是不可再分的数据单位
对数据项的描述数据项描述={数据项名,数据项含义说明,
别名,数据类型,长度,取值范围,
取值含义,与其他数据项的逻辑关系}
– 取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件
⒉ 数据结构
数据结构反映了数据之间的组合关系。
一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。
对数据结构的描述数据结构描述={数据结构名,含义说明,
组成,{数据项或数据结构}}
⒊ 数据流
数据流是数据结构在系统内传输的路径。
对数据流的描述数据流描述={数据流名,说明,数据流来源,
数据流去向,组成,{数据结构},
平均流量,高峰期流量}
– 数据流来源是说明该数据流来自哪个过程
– 数据流去向是说明该数据流将到哪个过程去
– 平均流量是指在单位时间(每天、每周、每月等)
里的传输次数
– 高峰期流量则是指在高峰时期的数据流量
⒋ 数据存储
数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。
对数据存储的描述数据存储描述={数据存储名,说明,编号,
流入的数据流,流出的数据流,
组成,{数据结构},数据量,存取方式}
– 流入的数据流:指出数据来源
– 流出的数据流:指出数据去向
– 数据量:每次存取多少数据,每天(或每小时、每周等)
存取几次等信息
– 存取方法:批处理 / 联机处理;检索 / 更新;顺序检索 /
随机检索
⒌ 处理过程
处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程的说明性信息
处理过程说明性信息的描述处理过程描述={处理过程名,说明,
输入,{数据流},输出,{数据流},
处理,{简要说明}}
处理过程(续)
– 简要说明:主要说明该处理过程的功能及处理要求
功能:该处理过程用来做什么
处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等
处理要求是后面物理设计的输入及性能评价的标准处理过程(续)
例:学生学籍管理子系统的数据字典。
数据项,以,学号,为例:
数据项,学号含义说明:唯一标识每个学生别名,学生编号类型,字符型长度,8
取值范围,00000000至 99999999
取值含义:前两位标别该学生所在年级,
后六位按顺序编号与其他数据项的逻辑关系:
处理过程(续)
数据结构 以,学生,为例
,学生,是该系统中的一个核心数据结构:
数据结构,学生含义说明,是学籍管理子系统的主体数据结构,定义了一个学生的有关信息组成,学号,姓名,性别,年龄,
所在系,年级处理过程(续)
数据流,体检结果,可如下描述:
数据流,体检结果说明,学生参加体格检查的最终结果数据流来源:体检数据流去向:批准组成,……
平均流量,……
高峰期流量,……
处理过程(续)
数据存储,学生登记表,可如下描述:
数据存储,学生登记表说明,记录学生的基本情况流入数据流,……
流出数据流,……
组成,……
数据量,每年 3000张存取方式,随机存取处理过程(续)
处理过程,分配宿舍,可如下描述:
处理过程:分配宿舍说明,为所有新生分配学生宿舍输入,学生,宿舍,
输出,宿舍安排处理,在新生报到后,为所有新生分配学生宿舍。要求同一间宿舍只能安排同一性别的学生,同一个学生只能安排在一个宿舍中。每个学生的居住面积不小于 3平方米。安排新生宿舍其处理时间应不超过 15分钟。