第 14讲 多媒体数据库技术第6章 多媒体数据库与超文本技术
6.1 MDBS体系结构
6.1.1 MDBS的研究内容
6.1.2 MDBS的层次结构
6.2 多媒体数据模型
6.2.1 层次-关系( H- R)模型
6.2.2 对象-关系( O- R)模型
△基于内容的检索
6.3.1 基于内容检索系统的体系结构
6.3.2 基于内容检索的关键技术第6章 多媒体数据库与超文本技术传统数据库:只能处理以文字方式表达的单一媒体信息;
不能适应多种媒体信息的综合处理要求多媒体数据库:需处理文本、图形、图像、动画、视频、音频等多种媒体信息;乃至超文本和超媒体信息
— 涉及许多新思想、新技术和新方法;
是支撑多媒体应用的关键技术之一
6.1 MDBS体系结构
6.1.1 MDBS的研究内容
1.多媒体数据管理基本内容:数据分类,组织,编码,存储,检索,维护
(1)数据分类,数据类抽象为数据类型;关系数据,媒体数据
(2)数据组织,数据形式描述,数据结构定义,数据类型定义等文件系统 — 描述非格式化数据(文图声文件结构)
数据库系统 — 描述格式化数据(如关系型数据结构)
(3)数据编码,数据的代码表示形式;数据项代码,数据流代码
(4)数据存储,以存储介质构成的物理存储环境与设备管理.如逻辑设备管理,物理设备管理;虚拟存储管理
(5)数据检索,数据提供查询与使用.主要内容包括,
存取路径定位,存取方法定义,存取权限管理,SQL接口等核心问题:数据表现机制,检索算法,时空同步机制
(6)数据维护,对基本数据结构和数据使用过程的管理与控制如库结构修改,记录一致性维护,分布更新,备份与转贮
2,MDBMS的功能特征
(1)多媒体数据表示,符合 MMUI技术规范的基本要求多数据类型和多交互方式的统一界面表示;
多用户/多视图的透明存取操作;独立于数据存储结构
(2)多媒体数据存取,取决于所采用的数据模型
a.层次/网状/关系/超文本/面向对象模型
b.数据元模型(原子特性)/信息元模型(复合语义关系)
c.时序模型/空间结构模型数据存取能力主要表现为:
① 具有支持多数据类型的数据结构
② 具有支持多交互方式的数据操作模型
③ 具有支持多数据源分布与透明存取的数据完整性约束
(3)多媒体数据管理,系统/并发/完整性控制.关键问题
①大对象存储管理与存取方法(如 Text,Image,Binary)
②长事务处理能力
③变长字段类型支持(如 Sybase,最大长度为 2G字节)
④基于内容的检索(如图像形状或颜色;声音的语义)
(4)多媒体数据库维护,数据库更新,索引重组,
库结构与字典维护,数据复制与转贮,版本管理等
(5)MMDB的网络通信,联机事务处理,并发与远程存取,
关系数据与超文本数据之间的信息交换,信息集成接口
(6)方法库支持,引入方法库思想及智能建模规则,
以实现多媒体数据的有效分解、组合和变换操作,
建立基于规则和标准算法的方法库,从而提高库管理效率
6.1.2 MDBS的层次结构
1.总体框架设计思想
(1)层次划分:多媒体应用层; MDBMS层;多媒体数据源
① 多媒体应用层,CAI,CSCW,视频会议,点播电视 VOD
② MDBMS层:定义了整个 MMDB框架体系结构的核心功能;
包括数据模型,存取方法,完整性约束,数据同步等
③ 多媒体数据源:用于描述数据存取与信息交换的数据资源源数据库和源文件;用户数据及类型;库位置及连接信息
(2)实现策略
① 每个功能层构成一个虚拟机,完成对下层的共性抽象,
并掩盖下层模块的实现细节;供上层模块调用
② 每个功能层可作子层分解,直至对象单元;乃至构件化
2.MDBMS总体功能描述 ( 关键和难点 )
(1)多媒体应用界面表示层,人机交互 → 可视化人-人交互
① 静态交互:窗口,按钮,菜单,文本输入域,热字
② 动态交互:移动对象,限次响应,限时响应,条件响应主要功能:
① 用户数据存取的外观设计表现 ( 一致性交互界面 )
② 通用 API或用户自定义界面表示 ( 如 MSQL)
③ 基于 HTML和 XML文档格式的数据浏览支持
(2)多媒体数据视图定义层
① 为应用界面提供外模式或子模式级的专用视图描述
② 为集成服务提供中性的逻辑视图描述与格式转换
③ 为概念模式提供语言编译,完整性检查和存取优化机制
(3)多媒体数据存取操作层,寻求一致性操作规范
① 操作模式,a.常规操作:排序,选择,查找;插删改
b.图像编辑:缩放,平移,旋转,覆盖,拼接,裁剪
c.声音编辑:声音合成,参数调整,A/ V同步
d.数据压缩编码/实时解码处理实现思路:多元组的集合操作 → 单纪录的对象操作
② 子层分解,a.基本存取层:提供对设备和文件的 I/ O操作
b.媒体存取层:提供各种单媒体的数据流存取操作
c.分布对象存取层:多种媒体合并为单媒体对象的特定操作
③ 存取路径定义要求,a.基于空间位置寻址的存取路径
b.基于时间点/时间段的时序数据流存取路径
c.基于内容与相似查询的存取路径
④ 存取算法:
a.传统查询方法,B树,B+树,倒排表,Hash变换
b.多维空间索引算法,R树,R*树,SR树,VP树,MVP树
⑤ 并发控制:使多用户多场地协同事务的集合操作串行化
a.封锁法及事务等待机制 — 用于冲突频繁的操作
b.乐观法及事务回退机制 — 用于冲突较少的操作
⑥ 实现过程:
a.确定数据映射到系统缓冲区逻辑页面上的记录编址方式;
以及编址前对数据进行压缩与实时解压的处理算法
b.提供快速有效的存取路径
c.采用高效的搜索算法和虚拟存储页面管理技术
d.进行 DML语义扩充,如使 SQL扩充为 MSQL;以扩充接口能力
(4)多媒体数据存储组织层,存储对象 — 针对数据源
① 库组织策略,a.关系数据库:存放格式化的常规数据
b.媒体库:存放非格式化的复杂数据 ( 文图声 )
c.特征库:存放输入或自动提取的内容特征信息及其参数
d.方法库:存不同数据类型或语义间的变换规则与通用算法
e.知识库:存放基于领域知识分析的智能推理算法
② 主要功能,a.数据页定义与存储分配:
( 逻辑页/缓冲区组织;外存上数据分配 )
b.系统缓冲区管理:读/写管理,页面更新,数据迁移等
c.内外存数据交换与外存管理:数据块预装入与内存分配;
交互命令模式控制;外存设备上的数据转储与复制
d.各种数据源/库之间的同步触发控制与动态连接
(5)多媒体数据集成服务层,对界面层和视图层的共性抽象
① 可视化界面的一致性描述规范
② 中性语义描述与翻译机制
③ 媒体的时空同步控制媒体同步策略,分为两个层次
① 用户级同步:采用层同步模型,
由用户通过人机交互对象控制媒体对象的表现同步
② 系统级同步:采用点同步模型 ( 时间轴同步 ),
用于内容对象内部各同步数据流的同步其它同步处理方法,Petri网的实时同步;分布对象的协同控制主要集成模型,HyTime模型,MHEG模型,
OCPN模型,LMDM模型,Agent模型
(6)MMDB运行管理内核程序,对存取层和存储层的共性抽象,
具有模块可重载能力;
可用于逻辑结构与物理结构之间的控制与协调,主要功能如
① 系统初始化
② 并发存取安全性控制
③ 数据约束完整性检查
④ 事务管理及数据一致性维护
⑤ 系统级的媒体流同步控制与实时控制
⑥ 系统运行日志管理及数据恢复
⑦ 分布目录管理
⑧ 版本管理
⑨ 数据通信例程
6.2 多媒体数据模型研究途径:改造传统的 DB模型;开发全新的 MDB模型
① 扩充的关系数据模型,RDBMS + 多媒体数据类型扩充
② 面向对象的数据模型:对象结构 + 数据处理语义规则
③ 超文本数据模型:节点 + 链扩充的关系数据模型:
关系数据库的优势:数据操作的关系代数描述方法;
SQL数据查询接口;
系统结构简单,界面清晰,易于扩充,应用十分普及多媒体扩充:大对象,长事务,变长数据存储;基于内容的检索扩充思路,① 关系数据的存储结构层次化 ( 层次-关系型 )
② 关系数据的语义结构对象化 ( 对象-关系型 )
6.2.1 层次-关系( H- R)模型设计思想:
① 关系:用于描述多种媒体数据类型的分类关系及其子集;
实现复杂对象操作界面的关系化
—— 用关系表加指针链的方法来改造关系模型的数据操作
② 层次:用于组织已分割成关系项的多种媒体数据,
层次间通过外部引用的数据指针来实现存取关联;
实现复杂对象存储结构的层次化
—— 用层次结构来改造关系模型的数据结构
③ 对多媒体数据语义表示和完整性约束规则进行相应扩充
(1) H- R模型的逻辑结构关键策略:
① 引用关系元组来描述多媒体数据分类 — 定义数据操作界面
② 引用层次树来组织关系数据项 — 定义数据存储结构定义,数据类型集是一个根关系 R,常规数据子集是一个子关系 R1,媒体数据子集是一个子关系 R2;
则基于关系元组的 H- R模型具有 两种主要实现策略:
① 把常规数据和媒体数据组织成一个完整的关系元组,
存放在系统缓冲区及其逻辑页面中 ( 适用于大型 MDBMS)
R = ( R1,R2)
R1 = { C,N,F,D,L,P}
R2 = { T,G,I,A,V,S}
② 把常规数据和媒体数据分割成两个互独立的关系数据集,
仅在必要时通过页面操作来访问媒体数据 ( 小型 MDBMS)
R = R1 + R2
R1 = { C,N,F,D,L,P}
R2 = { T,G,I,A,V,S}
逻辑结构设计可描述为:
(2) H-R模型的物理结构关键策略,① 允许关系表中嵌有指向数据存取对象的指针
— 对象操作关联;而对象本身是关系表中的另一数据类型
— 通过指针转移,调用单媒体数据
② 各种媒体数据类型均用关系数据结构表示 — 关系表存储结构设计:
6.1 MDBS体系结构
6.1.1 MDBS的研究内容
6.1.2 MDBS的层次结构
6.2 多媒体数据模型
6.2.1 层次-关系( H- R)模型
6.2.2 对象-关系( O- R)模型
△基于内容的检索
6.3.1 基于内容检索系统的体系结构
6.3.2 基于内容检索的关键技术第6章 多媒体数据库与超文本技术传统数据库:只能处理以文字方式表达的单一媒体信息;
不能适应多种媒体信息的综合处理要求多媒体数据库:需处理文本、图形、图像、动画、视频、音频等多种媒体信息;乃至超文本和超媒体信息
— 涉及许多新思想、新技术和新方法;
是支撑多媒体应用的关键技术之一
6.1 MDBS体系结构
6.1.1 MDBS的研究内容
1.多媒体数据管理基本内容:数据分类,组织,编码,存储,检索,维护
(1)数据分类,数据类抽象为数据类型;关系数据,媒体数据
(2)数据组织,数据形式描述,数据结构定义,数据类型定义等文件系统 — 描述非格式化数据(文图声文件结构)
数据库系统 — 描述格式化数据(如关系型数据结构)
(3)数据编码,数据的代码表示形式;数据项代码,数据流代码
(4)数据存储,以存储介质构成的物理存储环境与设备管理.如逻辑设备管理,物理设备管理;虚拟存储管理
(5)数据检索,数据提供查询与使用.主要内容包括,
存取路径定位,存取方法定义,存取权限管理,SQL接口等核心问题:数据表现机制,检索算法,时空同步机制
(6)数据维护,对基本数据结构和数据使用过程的管理与控制如库结构修改,记录一致性维护,分布更新,备份与转贮
2,MDBMS的功能特征
(1)多媒体数据表示,符合 MMUI技术规范的基本要求多数据类型和多交互方式的统一界面表示;
多用户/多视图的透明存取操作;独立于数据存储结构
(2)多媒体数据存取,取决于所采用的数据模型
a.层次/网状/关系/超文本/面向对象模型
b.数据元模型(原子特性)/信息元模型(复合语义关系)
c.时序模型/空间结构模型数据存取能力主要表现为:
① 具有支持多数据类型的数据结构
② 具有支持多交互方式的数据操作模型
③ 具有支持多数据源分布与透明存取的数据完整性约束
(3)多媒体数据管理,系统/并发/完整性控制.关键问题
①大对象存储管理与存取方法(如 Text,Image,Binary)
②长事务处理能力
③变长字段类型支持(如 Sybase,最大长度为 2G字节)
④基于内容的检索(如图像形状或颜色;声音的语义)
(4)多媒体数据库维护,数据库更新,索引重组,
库结构与字典维护,数据复制与转贮,版本管理等
(5)MMDB的网络通信,联机事务处理,并发与远程存取,
关系数据与超文本数据之间的信息交换,信息集成接口
(6)方法库支持,引入方法库思想及智能建模规则,
以实现多媒体数据的有效分解、组合和变换操作,
建立基于规则和标准算法的方法库,从而提高库管理效率
6.1.2 MDBS的层次结构
1.总体框架设计思想
(1)层次划分:多媒体应用层; MDBMS层;多媒体数据源
① 多媒体应用层,CAI,CSCW,视频会议,点播电视 VOD
② MDBMS层:定义了整个 MMDB框架体系结构的核心功能;
包括数据模型,存取方法,完整性约束,数据同步等
③ 多媒体数据源:用于描述数据存取与信息交换的数据资源源数据库和源文件;用户数据及类型;库位置及连接信息
(2)实现策略
① 每个功能层构成一个虚拟机,完成对下层的共性抽象,
并掩盖下层模块的实现细节;供上层模块调用
② 每个功能层可作子层分解,直至对象单元;乃至构件化
2.MDBMS总体功能描述 ( 关键和难点 )
(1)多媒体应用界面表示层,人机交互 → 可视化人-人交互
① 静态交互:窗口,按钮,菜单,文本输入域,热字
② 动态交互:移动对象,限次响应,限时响应,条件响应主要功能:
① 用户数据存取的外观设计表现 ( 一致性交互界面 )
② 通用 API或用户自定义界面表示 ( 如 MSQL)
③ 基于 HTML和 XML文档格式的数据浏览支持
(2)多媒体数据视图定义层
① 为应用界面提供外模式或子模式级的专用视图描述
② 为集成服务提供中性的逻辑视图描述与格式转换
③ 为概念模式提供语言编译,完整性检查和存取优化机制
(3)多媒体数据存取操作层,寻求一致性操作规范
① 操作模式,a.常规操作:排序,选择,查找;插删改
b.图像编辑:缩放,平移,旋转,覆盖,拼接,裁剪
c.声音编辑:声音合成,参数调整,A/ V同步
d.数据压缩编码/实时解码处理实现思路:多元组的集合操作 → 单纪录的对象操作
② 子层分解,a.基本存取层:提供对设备和文件的 I/ O操作
b.媒体存取层:提供各种单媒体的数据流存取操作
c.分布对象存取层:多种媒体合并为单媒体对象的特定操作
③ 存取路径定义要求,a.基于空间位置寻址的存取路径
b.基于时间点/时间段的时序数据流存取路径
c.基于内容与相似查询的存取路径
④ 存取算法:
a.传统查询方法,B树,B+树,倒排表,Hash变换
b.多维空间索引算法,R树,R*树,SR树,VP树,MVP树
⑤ 并发控制:使多用户多场地协同事务的集合操作串行化
a.封锁法及事务等待机制 — 用于冲突频繁的操作
b.乐观法及事务回退机制 — 用于冲突较少的操作
⑥ 实现过程:
a.确定数据映射到系统缓冲区逻辑页面上的记录编址方式;
以及编址前对数据进行压缩与实时解压的处理算法
b.提供快速有效的存取路径
c.采用高效的搜索算法和虚拟存储页面管理技术
d.进行 DML语义扩充,如使 SQL扩充为 MSQL;以扩充接口能力
(4)多媒体数据存储组织层,存储对象 — 针对数据源
① 库组织策略,a.关系数据库:存放格式化的常规数据
b.媒体库:存放非格式化的复杂数据 ( 文图声 )
c.特征库:存放输入或自动提取的内容特征信息及其参数
d.方法库:存不同数据类型或语义间的变换规则与通用算法
e.知识库:存放基于领域知识分析的智能推理算法
② 主要功能,a.数据页定义与存储分配:
( 逻辑页/缓冲区组织;外存上数据分配 )
b.系统缓冲区管理:读/写管理,页面更新,数据迁移等
c.内外存数据交换与外存管理:数据块预装入与内存分配;
交互命令模式控制;外存设备上的数据转储与复制
d.各种数据源/库之间的同步触发控制与动态连接
(5)多媒体数据集成服务层,对界面层和视图层的共性抽象
① 可视化界面的一致性描述规范
② 中性语义描述与翻译机制
③ 媒体的时空同步控制媒体同步策略,分为两个层次
① 用户级同步:采用层同步模型,
由用户通过人机交互对象控制媒体对象的表现同步
② 系统级同步:采用点同步模型 ( 时间轴同步 ),
用于内容对象内部各同步数据流的同步其它同步处理方法,Petri网的实时同步;分布对象的协同控制主要集成模型,HyTime模型,MHEG模型,
OCPN模型,LMDM模型,Agent模型
(6)MMDB运行管理内核程序,对存取层和存储层的共性抽象,
具有模块可重载能力;
可用于逻辑结构与物理结构之间的控制与协调,主要功能如
① 系统初始化
② 并发存取安全性控制
③ 数据约束完整性检查
④ 事务管理及数据一致性维护
⑤ 系统级的媒体流同步控制与实时控制
⑥ 系统运行日志管理及数据恢复
⑦ 分布目录管理
⑧ 版本管理
⑨ 数据通信例程
6.2 多媒体数据模型研究途径:改造传统的 DB模型;开发全新的 MDB模型
① 扩充的关系数据模型,RDBMS + 多媒体数据类型扩充
② 面向对象的数据模型:对象结构 + 数据处理语义规则
③ 超文本数据模型:节点 + 链扩充的关系数据模型:
关系数据库的优势:数据操作的关系代数描述方法;
SQL数据查询接口;
系统结构简单,界面清晰,易于扩充,应用十分普及多媒体扩充:大对象,长事务,变长数据存储;基于内容的检索扩充思路,① 关系数据的存储结构层次化 ( 层次-关系型 )
② 关系数据的语义结构对象化 ( 对象-关系型 )
6.2.1 层次-关系( H- R)模型设计思想:
① 关系:用于描述多种媒体数据类型的分类关系及其子集;
实现复杂对象操作界面的关系化
—— 用关系表加指针链的方法来改造关系模型的数据操作
② 层次:用于组织已分割成关系项的多种媒体数据,
层次间通过外部引用的数据指针来实现存取关联;
实现复杂对象存储结构的层次化
—— 用层次结构来改造关系模型的数据结构
③ 对多媒体数据语义表示和完整性约束规则进行相应扩充
(1) H- R模型的逻辑结构关键策略:
① 引用关系元组来描述多媒体数据分类 — 定义数据操作界面
② 引用层次树来组织关系数据项 — 定义数据存储结构定义,数据类型集是一个根关系 R,常规数据子集是一个子关系 R1,媒体数据子集是一个子关系 R2;
则基于关系元组的 H- R模型具有 两种主要实现策略:
① 把常规数据和媒体数据组织成一个完整的关系元组,
存放在系统缓冲区及其逻辑页面中 ( 适用于大型 MDBMS)
R = ( R1,R2)
R1 = { C,N,F,D,L,P}
R2 = { T,G,I,A,V,S}
② 把常规数据和媒体数据分割成两个互独立的关系数据集,
仅在必要时通过页面操作来访问媒体数据 ( 小型 MDBMS)
R = R1 + R2
R1 = { C,N,F,D,L,P}
R2 = { T,G,I,A,V,S}
逻辑结构设计可描述为:
(2) H-R模型的物理结构关键策略,① 允许关系表中嵌有指向数据存取对象的指针
— 对象操作关联;而对象本身是关系表中的另一数据类型
— 通过指针转移,调用单媒体数据
② 各种媒体数据类型均用关系数据结构表示 — 关系表存储结构设计: