数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 1页第 15章 数据仓库技术本章概述本章的学习目标主要内容数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 2页本章概述
前一章研究了用于广度计算的分布式数据库技术,
现在开始研究实现深度计算的数据仓库技术。在过去的几十年中,数据库技术主要是研究数据的采集和处理,或者说主要用于在线事务处理。然而,随着事务数据的逐渐积累和增加,如何充分利用现有数据的价值,成为了数据库技术的研究重点。今后,作为全球经济及技术管理者的信息工作者必须重视数据的战略价值,所面对的问题不是简单地处理数据而是如何充分地使用数据。
本章通过具体的数据仓库产品,研究数据仓库的技术和特征。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 3页本章的学习目标
理解数据仓库的概念和特征
理解和掌握数据挖掘技术的特点
理解和掌握数据中心库技术的特点
了解数据仓库的支持工具的特点
理解和掌握数据仓库的实现步骤
理解数据的粒度、分割和元数据的特点数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 4页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 5页
15.1 概述
数据仓库就是面向主题的、综合的、不同时间的、
稳定的数据集合,用于支持经营管理中的决策制定过程。也就是说,数据仓库是一个处理过程,
该过程从历史的角度组织和存储数据,并能集成地进行数据分析。简而言之,数据仓库就是一个大的数据库,存储了该公司所有业务数据,例如,
在线事务处理( OnLine Transaction
Processing,OLTP)系统中获取的综合数据,
这些数据可能驻留在许多不同的数据源中。这些数据源可能是文档、层次型数据库、网络结构化的数据库、反向列表数据库、关系型数据库或者更常见的由上述系统组成的混合系统。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 6页数据仓库特征
数据仓库可以辅助决策支持和在线分析处理( OnLine Analytical Processing,
OLAP)应用程序。
数据仓库除了具有传统数据库管理系统的共享性、完整性、数据独立性外,还具有下列特征:统一性和一致性;面向主题;
历史性;只读性。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 7页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 8页
15.2 数据挖掘和数据中心库
数据挖掘技术和数据中心库技术是数据仓库体系的重要组成部分。
下面详细介绍数据挖掘技术和数据中心库技术。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 9页数据挖掘技术
对大型的、复杂的、信息丰富的数据集的理解实际上是所有的商业、科学、工程领域的共同需要,
在商务领域,公司和顾客的数据逐渐被认为是一种战略资产。在当今的竞争世界中,吸取隐藏在这些数据后面的有用知识并利用这些知识的能力变得愈加重要。
运用基于计算机的方法,包括新技术,从而在数据中获得有用的知识的整个过程,叫做数据挖掘。
数据挖掘是一个反复迭代的过程数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 10页数据挖掘的基本任务
分类 —— 预测学习功能的发现,此功能将一个数据项分到几个预定义类中的一类。
回归 —— 预测学习功能的发现,此功能将一个数据项映射到一个真值预测变量。
聚类 —— 一种普遍的描述性任务,寻求以确定有限的一组类或簇来描述数据。
总结概括 —— 一项附加的描述任务,寻找对集或子集数据的简单描述的方法。
关联建模 —— 发现描述变量之间或者数据集或数据集的一部分的特征之间的重要的相关性的本地模型。
变化和偏差检测 —— 发现数据集中最重要的变化。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 11页数据中心库
微软及其数据仓库联盟伙伴开发了一系列的存储扩充工具以提供共同的开发结构。这种存储鼓励信息的共享 —— 例如数据结构、数据元、
数据传输,这些信息均被应用于数据仓库中。其它的数据元模型也能从开放式设计过程中产生,并且早期的模型还可以得到改进。共享的存储器增加了数据仓库和不同开发商所用工具之间的内部操作能力。
用户可从方便的系统管理、更多可选的兼容产品以及基于存储器的先进特性中收益。新型的存储器扩充通过给数据库和数据设计及分析工具销售商提供开放的、通用的结构,从而扩展了设计仓库的市场。为了提供更成功的数据仓库和数据交易功能,数据元的集成是当前最重要的任务。当主要的数据转换服务规定可用,并且在线分析处理延伸到存储器的开放式信息模型之后,开放的设计检验阶段便开始了。这些重要的扩展是指将几个信息模型增加到数据中心库内,从而可给开发者提供更多可选的兼容产品和数据仓库系统的先进特性。
微软数据中心库提供了一个通用的位置,可以用来存放对象和对象之间的关系。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 12页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 13页
15.3 数据仓库的支持工具
数据仓库的实现最终由许多支持工具来完成。在 Microsoft SQL Server中,提供了一些实现数据仓库的支持工具。这些工具包括 OLAP服务、数据转换服务、
PivotTable服务、英语查询工具等。
下面主要研究 OLAP服务、数据转换服务、
PivotTable服务的特点。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 14页
OLAP服务
OLAP描述的是一种多维数据服务(这里指的维是指人们观察客观世界的角度,例如时间、地域、
业务等),这种服务的设计目的是保证分析员、
经理和决策者针对特定的问题,通过快速、一致、
交互式的实时数据访问和分析,获得有创意的发现。
在 Microsoft SQL Server中,有三种用于存储数据仓库中维度数据的方法:
MOLAP
ROLAP
HOLAP
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 15页数据转换服务
数据转换服务( Data Transformation Services,
DTS)提供了数据转换功能,例如数据引入、引出以及在 Microsoft SQL Server和任何 OLE DB、
ODBC或者文本格式文件之间转换数据。利用
DTS,通过交互式地或者按照规划自动地(无须人工干预)从多处异构数据源输入数据,这样便有可能在 Microsoft SQL Server上建立数据仓库和数据集市。最大的问题是保持数据不断更新以与操作系统相适应。数据的来源特性允许用户输入查询数据的输入时间、地点及其计算方法。数据的引入引出是通过以相同的格式读写数据,在应用程序之间交换数据的过程。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 16页
PivotTable服务
PivotTable服务和 OLAP一起为用户提供客户端对 OLAP数据的存取。 PivotTable服务运行于客户端工作站商,它使得其部门可以利用 Visual
Basic或其它语言来开发用户程序,这些程序可以利用 OLE DB技术,并使用 OLAP服务中的
OLAP数据或直接取自关系数据库的数据。当它和 OLAP服务一起使用时,PivotTable服务可以自动的将进程和缓冲内存分配到最合适的位置,
并且允许多个客户动态存取同一个立方体。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 17页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 18页
15.4 数据仓库的实现步骤
一般地,设计和创建数据仓库的步骤是:
确定用户需求
设计和创建数据库
提取和加载数据仓库
下面详细研究每一步的主要内容。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 19页确定用户需求
确定终端用户的需要,为数据仓库中存储的数据建立模型。通过数据模型,可以得到企业完整而清晰的描述信息。数据模型是面向主题建立的,同时又为多个面向应用的数据源的集成提供了统一的标准。数据仓库的数据模型一般包括:企业的各个主题域、主题域之间的联系、描述主题的码和属性组。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 20页设计和建立数据库
设计和建立数据库是成功地创建数据仓库的一个关键步骤。这一步通常由有经验的数据库设计人员使用,因为这一步涉及的数据来自多种数据源并且要把它们合并成一个单独的逻辑模型。不象
OLTP系统那样以高度的正规化形式存储数据,
数据仓库中存储的数据以一种非常非正规化的形式存储数据以便提高查询的性能。
数据仓库常常使用星型模式和雪花型模式来存储数据,作为 OLAP工具管理的合计基础,以便尽可能快地响应复杂查询。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 21页星型模式数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 22页雪花模式数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 23页提取和加载数据
把操作型系统中数据提取出来然后加载到数据仓库中,随着复杂性的变化而变化。如果在数据源中的数据和将要出现在数据仓库中的数据是直接关联,那么这个进程非常简单。这个进程也可能非常地复杂,例如数据源的数据驻留在多个异构系统中,并且在加载数据之前需要大量的转变格式和修改。提取和加载数据的进程如下:
校验数据
迁移数据
数据净化
转换数据数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 24页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 25页
15.5 数据的粒度、分割和元数据
在建立数据仓库过程中,还要特别考虑的几个关键问题,例如:数据的粒度、数据的分割和元数据。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 26页粒度
粒度( Granularity of Data)是指数据仓库中数据单元的详细程度和级别。数据越详细,粒度越小,级别就越低;反之,数据综合度越高,粒度越大,级别就越高。
粒度的划分将直接影响到数据仓库中的数据量和所适合的查询类型,对数据仓库中其它的设计工作有很大的影响。通常需要将数据划分为:精细数据、轻度综合、高度综合等三级或更多级粒度。
不同粒度级别的数据用于不同类型的分析处理。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 27页数据分割
数据分割( Partitioning of Data)是指把逻辑上统一的数据分割成较小的、可以独立管理的物理单元进行存储,以便于重构、重组和恢复,以提高索引创建和顺序扫描的效率。数据的分割是数据仓库开发人员和用户有更大的灵活性。数据分割分为两种:系统级和应用级。系统级的分割是由数据库管理系统和操作系统实现的;应用级的分割是由开发人员通过代码来直接控制。因此,
应用级的分割更为灵活。在数据仓库的设计中,
较为普遍使用的是应用级的分割。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 28页元数据
元数据( Metadata)是数据仓库结构的一个重要部分,利用元数据能够最有效地管理数据仓库。
元数据的定义包括:面向程序员的数据结构;面向 DSS分析员的数据结构;数据仓库的数据来源;数据模型;数据模型与数据仓库的联系;数据抽取的历程。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 29页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结
前一章研究了用于广度计算的分布式数据库技术,
现在开始研究实现深度计算的数据仓库技术。在过去的几十年中,数据库技术主要是研究数据的采集和处理,或者说主要用于在线事务处理。然而,随着事务数据的逐渐积累和增加,如何充分利用现有数据的价值,成为了数据库技术的研究重点。今后,作为全球经济及技术管理者的信息工作者必须重视数据的战略价值,所面对的问题不是简单地处理数据而是如何充分地使用数据。
本章通过具体的数据仓库产品,研究数据仓库的技术和特征。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 3页本章的学习目标
理解数据仓库的概念和特征
理解和掌握数据挖掘技术的特点
理解和掌握数据中心库技术的特点
了解数据仓库的支持工具的特点
理解和掌握数据仓库的实现步骤
理解数据的粒度、分割和元数据的特点数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 4页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 5页
15.1 概述
数据仓库就是面向主题的、综合的、不同时间的、
稳定的数据集合,用于支持经营管理中的决策制定过程。也就是说,数据仓库是一个处理过程,
该过程从历史的角度组织和存储数据,并能集成地进行数据分析。简而言之,数据仓库就是一个大的数据库,存储了该公司所有业务数据,例如,
在线事务处理( OnLine Transaction
Processing,OLTP)系统中获取的综合数据,
这些数据可能驻留在许多不同的数据源中。这些数据源可能是文档、层次型数据库、网络结构化的数据库、反向列表数据库、关系型数据库或者更常见的由上述系统组成的混合系统。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 6页数据仓库特征
数据仓库可以辅助决策支持和在线分析处理( OnLine Analytical Processing,
OLAP)应用程序。
数据仓库除了具有传统数据库管理系统的共享性、完整性、数据独立性外,还具有下列特征:统一性和一致性;面向主题;
历史性;只读性。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 7页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 8页
15.2 数据挖掘和数据中心库
数据挖掘技术和数据中心库技术是数据仓库体系的重要组成部分。
下面详细介绍数据挖掘技术和数据中心库技术。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 9页数据挖掘技术
对大型的、复杂的、信息丰富的数据集的理解实际上是所有的商业、科学、工程领域的共同需要,
在商务领域,公司和顾客的数据逐渐被认为是一种战略资产。在当今的竞争世界中,吸取隐藏在这些数据后面的有用知识并利用这些知识的能力变得愈加重要。
运用基于计算机的方法,包括新技术,从而在数据中获得有用的知识的整个过程,叫做数据挖掘。
数据挖掘是一个反复迭代的过程数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 10页数据挖掘的基本任务
分类 —— 预测学习功能的发现,此功能将一个数据项分到几个预定义类中的一类。
回归 —— 预测学习功能的发现,此功能将一个数据项映射到一个真值预测变量。
聚类 —— 一种普遍的描述性任务,寻求以确定有限的一组类或簇来描述数据。
总结概括 —— 一项附加的描述任务,寻找对集或子集数据的简单描述的方法。
关联建模 —— 发现描述变量之间或者数据集或数据集的一部分的特征之间的重要的相关性的本地模型。
变化和偏差检测 —— 发现数据集中最重要的变化。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 11页数据中心库
微软及其数据仓库联盟伙伴开发了一系列的存储扩充工具以提供共同的开发结构。这种存储鼓励信息的共享 —— 例如数据结构、数据元、
数据传输,这些信息均被应用于数据仓库中。其它的数据元模型也能从开放式设计过程中产生,并且早期的模型还可以得到改进。共享的存储器增加了数据仓库和不同开发商所用工具之间的内部操作能力。
用户可从方便的系统管理、更多可选的兼容产品以及基于存储器的先进特性中收益。新型的存储器扩充通过给数据库和数据设计及分析工具销售商提供开放的、通用的结构,从而扩展了设计仓库的市场。为了提供更成功的数据仓库和数据交易功能,数据元的集成是当前最重要的任务。当主要的数据转换服务规定可用,并且在线分析处理延伸到存储器的开放式信息模型之后,开放的设计检验阶段便开始了。这些重要的扩展是指将几个信息模型增加到数据中心库内,从而可给开发者提供更多可选的兼容产品和数据仓库系统的先进特性。
微软数据中心库提供了一个通用的位置,可以用来存放对象和对象之间的关系。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 12页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 13页
15.3 数据仓库的支持工具
数据仓库的实现最终由许多支持工具来完成。在 Microsoft SQL Server中,提供了一些实现数据仓库的支持工具。这些工具包括 OLAP服务、数据转换服务、
PivotTable服务、英语查询工具等。
下面主要研究 OLAP服务、数据转换服务、
PivotTable服务的特点。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 14页
OLAP服务
OLAP描述的是一种多维数据服务(这里指的维是指人们观察客观世界的角度,例如时间、地域、
业务等),这种服务的设计目的是保证分析员、
经理和决策者针对特定的问题,通过快速、一致、
交互式的实时数据访问和分析,获得有创意的发现。
在 Microsoft SQL Server中,有三种用于存储数据仓库中维度数据的方法:
MOLAP
ROLAP
HOLAP
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 15页数据转换服务
数据转换服务( Data Transformation Services,
DTS)提供了数据转换功能,例如数据引入、引出以及在 Microsoft SQL Server和任何 OLE DB、
ODBC或者文本格式文件之间转换数据。利用
DTS,通过交互式地或者按照规划自动地(无须人工干预)从多处异构数据源输入数据,这样便有可能在 Microsoft SQL Server上建立数据仓库和数据集市。最大的问题是保持数据不断更新以与操作系统相适应。数据的来源特性允许用户输入查询数据的输入时间、地点及其计算方法。数据的引入引出是通过以相同的格式读写数据,在应用程序之间交换数据的过程。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 16页
PivotTable服务
PivotTable服务和 OLAP一起为用户提供客户端对 OLAP数据的存取。 PivotTable服务运行于客户端工作站商,它使得其部门可以利用 Visual
Basic或其它语言来开发用户程序,这些程序可以利用 OLE DB技术,并使用 OLAP服务中的
OLAP数据或直接取自关系数据库的数据。当它和 OLAP服务一起使用时,PivotTable服务可以自动的将进程和缓冲内存分配到最合适的位置,
并且允许多个客户动态存取同一个立方体。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 17页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 18页
15.4 数据仓库的实现步骤
一般地,设计和创建数据仓库的步骤是:
确定用户需求
设计和创建数据库
提取和加载数据仓库
下面详细研究每一步的主要内容。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 19页确定用户需求
确定终端用户的需要,为数据仓库中存储的数据建立模型。通过数据模型,可以得到企业完整而清晰的描述信息。数据模型是面向主题建立的,同时又为多个面向应用的数据源的集成提供了统一的标准。数据仓库的数据模型一般包括:企业的各个主题域、主题域之间的联系、描述主题的码和属性组。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 20页设计和建立数据库
设计和建立数据库是成功地创建数据仓库的一个关键步骤。这一步通常由有经验的数据库设计人员使用,因为这一步涉及的数据来自多种数据源并且要把它们合并成一个单独的逻辑模型。不象
OLTP系统那样以高度的正规化形式存储数据,
数据仓库中存储的数据以一种非常非正规化的形式存储数据以便提高查询的性能。
数据仓库常常使用星型模式和雪花型模式来存储数据,作为 OLAP工具管理的合计基础,以便尽可能快地响应复杂查询。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 21页星型模式数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 22页雪花模式数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 23页提取和加载数据
把操作型系统中数据提取出来然后加载到数据仓库中,随着复杂性的变化而变化。如果在数据源中的数据和将要出现在数据仓库中的数据是直接关联,那么这个进程非常简单。这个进程也可能非常地复杂,例如数据源的数据驻留在多个异构系统中,并且在加载数据之前需要大量的转变格式和修改。提取和加载数据的进程如下:
校验数据
迁移数据
数据净化
转换数据数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 24页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 25页
15.5 数据的粒度、分割和元数据
在建立数据仓库过程中,还要特别考虑的几个关键问题,例如:数据的粒度、数据的分割和元数据。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 26页粒度
粒度( Granularity of Data)是指数据仓库中数据单元的详细程度和级别。数据越详细,粒度越小,级别就越低;反之,数据综合度越高,粒度越大,级别就越高。
粒度的划分将直接影响到数据仓库中的数据量和所适合的查询类型,对数据仓库中其它的设计工作有很大的影响。通常需要将数据划分为:精细数据、轻度综合、高度综合等三级或更多级粒度。
不同粒度级别的数据用于不同类型的分析处理。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 27页数据分割
数据分割( Partitioning of Data)是指把逻辑上统一的数据分割成较小的、可以独立管理的物理单元进行存储,以便于重构、重组和恢复,以提高索引创建和顺序扫描的效率。数据的分割是数据仓库开发人员和用户有更大的灵活性。数据分割分为两种:系统级和应用级。系统级的分割是由数据库管理系统和操作系统实现的;应用级的分割是由开发人员通过代码来直接控制。因此,
应用级的分割更为灵活。在数据仓库的设计中,
较为普遍使用的是应用级的分割。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 28页元数据
元数据( Metadata)是数据仓库结构的一个重要部分,利用元数据能够最有效地管理数据仓库。
元数据的定义包括:面向程序员的数据结构;面向 DSS分析员的数据结构;数据仓库的数据来源;数据模型;数据模型与数据仓库的联系;数据抽取的历程。
数据库系统原理与应用教程 (第二版 ) 第 15章 数据仓库技术 第 29页主要内容
15.1 概述
15.2 数据挖掘和数据中心库
15.3 数据仓库的支持工具
15.4 数据仓库的实现步骤
15.5 数据的粒度、分割和元数据
15.6 本章小结