第四讲 数据资源管理技术教学计划
教学进度表授课主题 学时 状态 备注
1,MIS的基本概念 ( 6)
2,MIS的技术基础 ( 4)
3:数据资源管理 ( 6) No.1
4,MIS的应用 ( 6)
6,MIS的开发方法 ( 6)
7,MIS的分析与设计 ( 6)
8,MIS的实施 ( 4)
9:实验项目 ( 10)
10:课程评价 ( 2)
教学目标
理解并掌握
– 数据资源的管理观
– 数据资源的管理技术教学内容
本讲共计 4学时
– 第十章 4学时第十章 数据资源管理技术
主要内容
– 文件组织
– 数据库技术
10,引言
企业的重要资源
– 劳动力、原材料、资金、设备、信息
广义的数据资源管理包括:
– 文件组织
– 数据库
– 数据规划
– 数据管理
10.1 文件组织
数据组织的层次
– 人们需要用数据来进行决策和采取行动
如果这些数据能够在限定的时间内被检索处理,这些数据就产生了价值,成为信息。因此需要将数据有序的组织起来,才能对数据进行有效的处理。
– 数据的逻辑组织有四个基本的逻辑元素:
数据项
记录
文件
数据库
10.1 续
数据组织的层次数据库文件 1 文件 2 文件 n文件 n-1
记录 1 记录 2 记录 n-1 记录 n
数据项 1 数据项 2 数据项 n-1 数据项 n
…...
…...
…..,姓名、性别等若干学生学生文件学生数据库
10.1 续
数据组织的相关概念
– 数据项
是组成数据系统的有意义的最小基本单位。它的作用是描述一个数据处理对象的某些属性。
– 记录
与数据处理的某一对象有关的一切数据项构成了该对象的一条记录。标识记录的数据项称为关键项。
– 文件
相关(同类)记录的集合称为文件。
– 数据库
按一定方式组织起来的逻辑相关的文件集合形成数据库。
10.1 续
文件的管理观
– 大量的企业数据不可能存放在主存中
– 某一时刻,企业只使用其中的一部分数据
– 企业的数据一般以文件形式组织起来
分类
– 按存储介质
光盘文件
磁盘文件
打印文件
– 按文件在信息系统中所执行的功能
主文件
事务文件
报告文件
工作文件
程序文件
10.1 续
数据的物理储存与传送
– 自学问题
磁盘与磁带在数据存储方面各有什么特点?
什么是数据的逻辑组织?
什么是数据的物理组织?
如何实现逻辑组织与物理组织之间的数据传送?
10.1 续
文件组织形式
– 建立并确定数据记录的物理顺序和逻辑顺序之间的对立关系。
逻辑数据记录 物理存储方式顺序文件索引文件链表文件倒排文件顺序映射关系
10.1 续
顺序文件
– 文件中数据记录的物理顺序与逻辑顺序一致,文件记录按关键字值的递增(或递减)次序排序,形成其逻辑顺序。
870001 张三 456
870002 李四 645
870003 王五 587
870004 孙六 676
870005 钱七 565
…… …… ……
1
2
3
4
5
……
文件记录 物理设备关键字值 相对磁道
10.1 续
索引文件
– 具有索引表的文件称为索引文件。
索引文件主文件 索引表数据记录区 索引区记录原始信息 记录关键字 +记录地址组成映射加工
10.1 续
举例记录地址 学号 姓名 成绩
A 870005 张三 456
B 870002 李四 645
C 870001 王五 587
D 870004 孙六 676
E 870003 钱七 565
主关键字(学号) 记录地址
870001 C
870002 B
870003 E
870004 D
870005 A
主文件 索引表关键字学号与学生记录地址的对应表
10.1 续
链表文件
倒排文件
– 带有辅索引或倒排索引的文件称为倒排文件记录 记录 记录 记录 ^
入口
10.2 数据库技术
传统文件处理系统
存在问题
– 数据冗余与数据不一致性
– 数据结构的不一致,数据联系弱
– 缺少数据字典,缺少灵活性应用程序 1 数据文件 1
应用程序 2
应用程序 3
数据文件 2
数据文件 3
用户用户用户
10.2 续
银行文件处理系统客户财务报表分期贷款程序帐户核对处理存款处理分期贷款处理 贷款分析报告客户票据存款文件修改文件修改核对帐户核对程序分期贷款文件修改存款程序客户交易客户交易
10.2 续
数据库处理系统
优点
– 完善的数据字典和数据模型
– 数据独立性
– 方便的接口
– 完整的数据控制功能
– 提高了系统的灵活性应用程序 1
应用程序 2
应用程序 3
DBMS
数据库中央数据库用户用户用户
10.2 续
银行数据库处理系统客 户 交 易 处 理数 据 库 管 理 系 统核对帐户程序存款帐目程序分期贷款程序客户数据库
..查询
10.2 续
数据库管理系统( DBMS)功能
– DBMS是一组计算机程序,控制组织和用户的数据库的生成、维护和使用。具有以下功能:
– 数据库开发
– 数据库查询
– 数据库维护
– 应用与开发
..
操作系统数据库管理系统应用程序数据库数据字典用户
10.2 续
数据库管理系统( DBMS)
– 数据库开发:
利用数据定义语言( DDL)开发与说明数据内容、相互关系及每个数据库的结构。并把这些信息存储在一个专用的数据定义和说明的数据库中,称为数据字典。数据字典由数据库管理员控制、管理和维护。
– 数据库查询:
用户使用 DBMS的查询语言询问数据库中的数据。最常用的查询语言是结构化查询语言( SQL)。
– 数据库维护
– 应用开发
10.2 续
数据库有哪些类型?
– 企业数据库的种类
操作数据库
管理数据库
信息仓库
分布式数据库
外部数据库
– 文本数据库
– 多媒体数据库
10.2 续
数据库模型
– 模型功能
使数据以记录的形式组织在一起,综合反映各种业务信息,既综合又没有冗余。
模型能反映用户各业务信息所存在的内在联系,而且与 DBMS
数据模型一致。
– 模型的类型
网状型
层次型
关系型(目前最流行的是关系型数据库)
10.2 续
数据库系统的三级模式
– 模式
即逻辑模式。是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
– 外模式
用户模式或者子模式。是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述。
– 内模式
物理模式或者存储模式。是数据物理结构和存储方式的描述,是数据在数据库内部的表示方法。
– 参见 159页图 10.11
10.2 续
数据库系统的三级模式(图)
物理模型内模式用户 A 用户 B 用户 D 用户 E
外模式 1(子模式 1) 外模式 2(子模式 2)
概念模型(模式)
DBMS
OS
子模式 /概念模式映射 A 子模式 /概念模式映射 B
模式 /内模式映射
10.2 续
数据库的二级映射
– 外模式 /模式映射:
当模式改变时,使外模式保持不变,从而应用程序不变,保证了数据与程序的逻辑独立性。
– 模式 /内模式映射:
当数据库存储结构改变,使模式保持不变,从而应用程序不变,
保证了数据与程序的物理独立性
10.2 续
数据库数据的存取过程应用程序 A
用户工作区 状态码系统缓冲区数据库 OS
DBMS
物理数据库描述概念模式应用程序 A的子模式
10.2 续
信息的转换客观 事物类:
事物 相关性质集合 人实体 实体集合及 实体联系 相关属性集合加工、转换数 文件据 记录库 相关数据项集合加工转换存储二进制数据集合结构计算机世界 DBMS 数据世界
DBMS
的数据模型信息世界认识选择描述现实世界
E-R模型
10.2 续
三个不同世界术语
– 客观世界 信息世界 数据世界组织(事物及其联系) 实体及其联系 数据库(概念模型)
事物类(总体) 实体集 文件事物(对象、个体) 实体 记录特征(性质) 属性 数据项实体及其联系 概念模型
E— R图
10.3 E-R信息模型的设计与应用
E-R图描述现实世界的概念模型
– 实体:
– 属性:
– 联系:
一对一联系
一对多联系
多对多联系实体集属性联系集 线段
10.3 续
E—R图设计原则
– 真实性原则
– 避免冗余原则
– 简单性原则
– 合适性原则(用实体或属性或联系集)
– 注意对客观对象的约束
映射约束、键码约束、参照完整性约束
10.3 续
实体( Entity):
– 是一个有着一系列显著的、易辨认的属性的对象。
– 实体可以是具体的(物体、人物等。)
– 实体也可以抽象的(事、概念、事物之间的联系)
确定实体的指导
– 找出问题中的大模块
– 问题陈述中的名词
10.3 续
属性( Attribute)
– 实体的特性,它描述了实体的一个部分。
– 一个实体可由若干个属性来刻画。
如学生(学号,姓名,性别,…… )
码( Key):
– 唯一标识实体的属性集。
如:学号为学生的码。
确定属性的指导
– 可能将名词当作属性,但不应将其和实体混淆,
10.3 续
E—R图绘制图书 作者写作出版社类别页数ISBN
书名姓名出生地身份证号定稿时间价格 包含实体集“图书”和“作者”的 E—R图
10.3 续
E—R图向关系数据模型的转换
– 1,E—R图中每个实体,相应转换为一个关系,该关系包括对应实体的全部属性,并确定出该关系的关键字。
– 2、对于“联系集”,根据联系方式不同,采取不同手段以使被它联系的实体所对应的关系彼此实现某种联系。
10.3 续
E—R图向关系数据模型的转换转换过程示意图
E-R图关系模型
DBMS
10.3 续
E—R图的转换
– 将 E-R图转换成相应的表
表是行和列的集合,实体被表示成表的形式。
用列标题表示实体的属性
用行表示关于实体的实际数据
关于表和属性的命名规则
– 属性名和表名中不能包含空格
– 表名对实体的描述应该是有意义的。
如 student(cStuID,cStuName,nStuAge,……)
– 表名只能描述一个主题
10.3 续
转换举例一厂长号 姓名 年龄厂长厂号 厂名 地点工厂管理1 1
厂长( 厂长号,厂号,姓名,年龄)
工厂( 厂号,厂名,地点)
10.3 续
转换举例二仓库号 地点 面积仓库货号 品名 价格产品存放1 n
仓库( 仓库号,地点,面积)
产品( 货号,品名,价格,仓库号,数量)
数量
10.3 续
转换举例三学号 姓名 年龄学生课程号 课程名 学时数课程学习n n
学生( 学号,姓名,年龄)
课程( 课程号,课程名,学时数)
成绩学习( 学号,课程号,成绩)
10.4 数据库设计规范化
数据库设计规范化 ——范式理论篇( P345)
– 必要性:解决在关系模式设计时,存在的数据存储异常现象:数据冗余、修改异常、插入异常、删除异常等。
ISBN 书名 页数 价格 出版社 作者
7-04-001968-O.719 概率论 403 5.8 高教出版社 盛聚
7-04-001968-O.719 概率论 403 5.8 高教出版社 谢式千
7-111-06887-4 可靠性模型与应用 270 19.0 机械工业出版社 蒋仁言
7-111-06887-4 可靠性模型与应用 270 19.0 机械工业出版社 左明健
7-5327-1224.9/1.717 基督山伯爵 1428 18.0 止海译文出版社 大仲马
7-5237-1224-9/1.321 三个火枪手 982 16.7 上海译文出版社 大仲马
10.4 续
第一规范型:
– 如果一个关系模式中的属性都是单纯的(即不可再分为更小的属性),则称该 模式是属于第一规范型
( First Normal Form,即 1NF )。
姓名 地址省 市 街道 邮编甲 江苏 南京 卫岗 210095
10.4 续
第二规范型:
– 如果一个关系模式属于 1NF,并且所有的非关键字都完全地依赖于关键字(即不存在部分依赖),则称该关系模式属于第二规范型,即 2NF 。
A
零 件 号
B
仓 库 号
C
零 件 数 量
D
仓 库 地 址
1
2
3
4
1
1
1
2
1 0 0
1 5 0
2 0 0
1 5 0
北 区 1 号北 区 1 号北 区 1 号南 区 1 号
10.4 续
第三规范型:
– 如果一个关系模式属于 2NF,并且不存在非关键字传递地依赖于关键字,则称该关系模式属于第三规范型
( 3NF)。
职工号 职工 职务 工资
1001 张三 工程师 200
1002 李四 技术员 120
1005 王五 高工 350
10.4 续
适当的规范化规范化程度越高 数据冗余更新异常连接运算时间查询时间效率自学任务再见
Do you have made a progress today?