第 1 章
?多媒体技术概述
1.1、多媒体技术及其基本特性
1.1.1、多媒体与媒体
Multi + Media = Multimedia
媒体:指交流、传播信息的工具。
媒体 (medium)
媒体 是承载信息的载体。, 载体,
是指承载知识或信息的物质形体。
媒体的种类:
感觉媒体、表示媒体、表现媒体、存储媒
体及传输媒体。
感觉媒体
能直接作用于人的感官,让人产
生感觉的媒体。 例如:通过视觉
看到 的文字、图形;通过听觉 听
到 的音乐、语音等。
表示媒体
为传播和表达某种感觉媒体
所指定的各类信息的编码与
格式。 例如,语言编码,电
报码,图像编码,...
表现媒体
用于输入和输出感觉媒体的载体。
? 输出媒体
显示器,扬声器,打印机,...
? 输入媒体
键盘,鼠标,扫描仪,...
存储媒体
用于存放表示媒
体的载体 。例如:
内存、软磁盘、
硬盘、光盘、纸
张,...
传输媒体
用于把表示媒体从一处
传输到另一处的物理实
体 。例如:各种导线、
电缆、电话线、光纤,...
各种媒体形式的关系
表现媒体
(输入设备) 存储媒体
表现媒体
(输出设备)
感觉
媒体
感觉
媒体
表示
媒体
表示
媒体
1.1.2、多媒体数据的特点
?数据量大
?数据类型多
?数据类型之间的差别大
?多媒体数据的输入输出复杂
多媒体数据的多通道异步输入过程
声音通道
图像通道
文字通道
显示
播放
声音
图像
文字
存储
合成
表现
多媒体技术定义
多媒体技术是指计算机 综合处理 文
本、图形、图像、动画、音频及视
频等多种信息,使它们建立一种逻
辑连接,并集成为一个具有交互性
的系统的技术。
1.1.3 多媒体技术及特性
多媒体技术的特性
? 多样性,指信息媒体的多样性
? 交互性,指用户可以与计算机的多种信息媒体进行
交互操作,从而为用户提供更加有效地控制和使用
信息的手段
? 集成性,指以计算机为中心综合处理多种信息媒体,
它包括信息媒体的集成和处理这些媒体设备的集成
? 实时性:音频信息与视频信息均与时间有关
1.2、多媒体个人计算机系统的组成结构
,多媒体计算机,
可以处理数值、文字、图像、动画、音
频、视频等信息的计算机被称为多媒体
计算机。它具有速度快、存储容量大、
能实时处理的特点。
多媒体计算机的分类
?基于 IBM PC系列的多媒体
个人计算机( MPC)
?基于 Apple Macintosh系列的
计算机
Macintosh简介
Macintosh是名副其实的 多媒体计算机 。
1984年 首次公布新机型。是鼠标、图形
用户界面和超文本的 先驱 。 操作系统 是
System 7.x。新一代的 Macintosh计算机
不需要任何附加硬件就能够 直接 处理数
字化声音;多数机型有 8位,16位,32位
的图形处理 能力,高档机型还可以 直接
对视频进行数字化处理。
PC简介
1981年推出面向商业的个人计算
机。多媒体的大部分硬件功能是
通过各种附加插件板实现的;软
件则从 Windows3.1 起支持多媒
体功能。
多媒体 PC机( MPC)
MPC=multimedia personal computer
具有特定多媒体功能的 PC机。 1990年“多
媒体微机市场协会”指定了 MPC标准。该
标准规定了将一个以 Intel处理器芯片为基
础的计算机转变成为多媒体计算机的最低
软硬件规范。
多媒体计算机系统结构
多媒体应用系统
多媒体创作系统
多媒体核心系统
多媒体 I/O接口
多媒体实时压缩与解压缩
计算机硬件系统
1.3、多媒体个人计算机标准
Level1 MPC标准
?CPU 80386SX 主频 16MHz
?内存, 2MB
?磁盘, 30MB硬盘
?显示器,分辨率 640*480 16色
?CD-ROM,持续传输率 150KB/秒,
平均寻址时间 1s,支持 ISO 9660,
CD AUDIO标准
?声音卡, 采样 8位
Level2
MPC标准?CPU 80486SX ?内存, 4MB
?硬盘, 160MB硬盘
?CD-ROM, 持续传输率为 300KB/秒,
平均寻址时间 400ms,支持 ISO 9660,
CD AUDIO,CD-ROM XA,
Photo CD标准
?声音卡, 采样 16位
1.4、多媒体的关键技术
?数字音频和视频技术
?多媒体软件平台技术
?多媒体通信技术
?多媒体数据库技术
1.5、多媒体技术的发展
?84年,Apple公司引入位图概念
?85年:推出了世界上第一台多媒体系统
?86年:推出了交互式紧凑光盘系统 CD-I
?87年:推出交互式数字视频系统 DVI
?90年:指定 MPC_I级标准
?91年:推出 CD-ROM/XA标准
?92年:正是公布 MPEG-I数字电视标准
?93年:推出了 MPC_II级标准
多媒体系统的三要素
?用于视频和音频信息处理的多媒
体硬件
?多媒体操作系统
?支持多媒体的软件开发和编辑工
具
第 2章
文本信息处理技术
2.1 文本信息的获取与表现
文本信息是计算机最初、最简单的
表现形式。所谓文本就是 由字符组
成的字符序列 。
2.1.1 文本信息的主要特点
文本信息 容易处理,存储量小,
存取速度快,符号结构规范,因
此最适于计算机的输入、存储、
处理与输出,所表达的内容清晰
而精确。
2.1.2 文本信息的获取方式
1、键盘输入方式
2、手写输入方式
3、语音输入方式
4、利用扫描仪输入方式
手写输入方式
手写输入系统由
硬件 和 软件 两部
分组成。可以通
过软件实现 连笔
识别, 倒插笔识
别, 联想字识别,
同音字识别, 同
行字识别,并具
有自学习功能。
手写输入板和笔
清华紫光手写输入法
与 Windows输入法联袂
清华紫光手写输入
法可直接在一些应
用软件中进行输入
利用扫描仪获取文本信息的基本过程
?安装设备
?设置扫描仪的扫描属性
?将需要的文字通过扫描仪以图像的形
式扫入计算机, 并将其存储在一个图
像文件中
?运行 OCR软件
?打开待识别的图像文件
?根据提示进行修整
2.1.3 在多媒体集成工具中导入文本信息
?直接利用多媒体集成工具提供的文本输入
功能键入文本信息。适用于文字量较少时
?利用 OLE技术嵌入 Microsoft Word或书写
器对象。适用于文字量较大时
利用 OLE 技术嵌入 Microsoft
Word 或书写器对象
OLE( Object Link and Embedding)
是一种对象链接与嵌入技术。它可以
将 Windows环境下不同应用程序创建
的数据作为对象链接或嵌入到其他的
应用程序中。其中提供数据对象的应
用程序被称为 服务应用程序,链接或
嵌入数据对象的应用程序被称为 客户
应用程序 。若在一个文档中含有多个
数据对象,就将其称为 复合文档 。
利用 OLE 技术嵌入 Microsoft
Word 或书写器对象
?在客户应用程序中直接嵌入服务
应用程序
?直接嵌入 Word文档
?将文本图形化,并以图像文本的
形式插入到多媒体应用系统中
2.1.4 文本信息在多媒体中的表现形式
,修饰文本表现外观的方式,
( 1) 选择字体,选择原则:各部分字体统一;字体
种类不宜过多;严肃的内容应该选择庄重的字体 。
( 2) 选择字号,字号不宜过小, 通常应该使人能够
很快地浏览完一个画面的内容 。
( 3) 选择字形,对于重点内容或关键词可以选择特
殊的字形, 但种类不宜过多 。
( 4) 设置颜色,与整体画面配合和谐, 颜色变化不
宜过杂 。
2.2 文本信息的编辑处理
在多媒体应用系统的制作中, 也需要对
文本内容进行修改, 因此在多媒体集成
工具中都提供了文本编辑功能, 比如,
文本剪切, 复制, 粘贴, 插入, 删除等
等 。 实际上对文本的编辑处理还包括对
其进行格式化 。
2.2.1 Windows中的字体
字体主要分为两种:
?点阵字体 是指利用点阵设计每个字符显
示的外观 。 其特点是在放大, 缩小或输
出到打印机上时不很理想, 但在几种特
定的尺寸下, 其显示效果比较好 。
?TrueType字体 中的每个字符是通过存储
在计算机中的一系列指令绘制出来的 。
其特点是在任何尺寸下都能够正常地显
示, 可以放大, 缩小, 旋转, 且显示效
果依然良好 。
2.2.2 格式化文本
格式化文本包括:设置字体、字形、
字号、颜色、字间距、行间距、段
落格式等。具体实现方法有两种:
1、利用 OLE功能链接相应的服务应
用程序;
2、在专门的文本编辑软件中格式化
后,利用屏幕拷贝功能将其转换成
图像,然后再导入多媒体应用系统
的画面中。
2.3 扫描仪
扫描仪的基本组成,扫描仪主要由扫描
头、控制电路和机械部件等组成。扫描
头由光源、光敏元件和光学镜头等组成。
光源通常采用条状白色发光二极管或冷
阴极管,也有一些彩色扫描仪采用黄绿
色发光二极管的。
基本工作原理
工作时照射到原稿上的光反射(或透射)到电
荷耦合器件( CCD)上,电荷耦合器件本身是
由许多单元组成的,因此在接收光信号时将连
续的图像分解成分离的点(像素),同时将不
同强弱的亮度信号变成幅度不同的电信号,再
经过模数转换成为数字信号。扫描完一行后,
控制电路和机械部件让扫描头移动一小段距离,
继续扫描下一行。扫描得到的数字信号以点阵
的形式保存,再使用文件编辑软件将它编辑成
标准格式的文件,存储在磁盘上,以便进一步
处理。
扫描仪的主要性能指标
1、分辨率
2、色彩数量
3、灰度级数
4、扫描幅面
5、扫描速度
扫描仪的分类
按外观分类
?平板式
?手持式
?滚筒式
按接口分类
?并行接口
?CSSI接口
?USB接口
第 3 章
音频信息处理技术
3.1 音频信息的处理
由于人们在接收外界信息以及与他
人进行交流的过程中, 大约有 20%
是通过听觉实现的, 所以音频 ( 声
音 ) 是多媒体计算机技术中一种不
可缺少的媒体 。 也正是由于多媒体
计算机具有处理音频媒体的能力,
才使得计算机走出无声的世界, 像
人性化迈进了一步 。
3.1.1 多媒体中的音频信息
声音是由物体振动引发的一种物理
现象 。 例如, 讲话时声带的振动,
小提琴弦的振动, 扬声器纸盆的振
动都会造成空气的振动, 这种振动
会不断地向四周传播, 当被人耳接
收时, 我们就听到了声音 。
声音媒体分为三类
?波形声音,实际上已经包含了所有声音
形式, 这是因为计算机可以将任何声音
信号通过采样, 量化数字化, 在必要的
时候, 还可以准确地将其恢复 。
?语音,人的说话声不仅是一种波形, 而
且还通过语气, 语速, 语调携带着比文
本更加丰富的信息 。 这些信息往往可以
通过特殊的软件进行抽取 。
?音乐,音乐是一种符号化了的声音, 这
种符号就是乐谱, 乐谱则是转变为符号
媒体形式的声音 。
声音媒体具有三个要素
?音调,与声音的频率有关,频率越
快,音调就越高。
20 H z 20k H z
声音 (音频) 超音频亚音频
300 ~3 00 0 Hz 人说话的频率范围
?音强,又称为响度, 它取决于声音的振
幅 。 振幅越大, 声音就越响亮 。
?音色,音色是由于波形和泛音的不同所
带来的一个声音属性 。
,纯音, 一般的声音由几种振动频率的波组
成, 若该声音只有一种振动频率就叫做纯音;
,复音, 由许多纯音组成, 复音的频率用组
成这个复音的基音频率表示, 一般的乐音都
是复音;
,基音, 是复音中频率最低部分的声音;
,泛音, 在一个复音中, 除去基音外, 所有
其余的纯音都是泛音 。
几种常见的声音频宽
声音类型 频宽
电话语音 200Hz~3.4kHz
调幅广播 50Hz-7kHz
调频广播 20Hz~15kHz
宽带音响 20Hz~20kHz
3.1.2 数字化声音信号
声音是由物体的振动产生的,这种振动
引起了周围空气压力的震荡,我们称这
种震荡的函数表现形式为 波形 。
若使用计算机处理声音信息,首先
要解决的问题就是声音信号的数字
化,即将用连续波形曲线表示的声
音信号,在时间和幅度值上离散化。
在时间轴上,每隔一个固定的时间间隔
(虚线表示)对波形曲线的振幅进行一
次取值,这被称为 采样 。由于曲线在振
幅方向是连续的,所以必须将无限个可
能的取值映射到计算机可表示的一个有
限取值范围内(通常是一个整型取值范
围),这被称为 量化 。
时间
振
幅
值
采样量化的结果将用所得到的数值
序列表示原始的模拟声音信号,这
就是将模拟声音信号数字化的 基本
过程 。
采样 量化
声音的模拟信号 声音的数字信号
影响数字化声音质量的因素
?采样频率,每秒钟采取声音信号振幅数
值的次数,单位是 Hz。采样频率越高,
数字化后的声音越接近原始声音,但需
要的存储空间也越多。
?量化位数,表示采样数值所使用的二进
制位数。二进制位数越多,表示的数值
范围越大,量化后振幅的精度越高。
?声道数,有单声道和双声道两种。
数字化声音文件的大小
数据量 ( 字节 /秒 ) =
采样频率 ?量化位数 ?声道数
8
3.1.3 音频信息的获取形式
利用 Windows的“录音机”录制声音的过
程:
1.将麦克风插头插入声卡提供的标有,Mic”
的插口,并确认已连接好。
2.点击“开始 /程序 /附件 /娱乐 /录音机”,
以便打开“录音机”窗口。
3.在“录音机”窗口中,点击“文件 /新
建”。
4.点击“录音”按钮开始录音。
5,点击, 停止, 按钮停止录音 。
6,点击, 文件 /另存为,, 将刚刚录制好的
声音存成一个声音文件 。
―录音”需要注意的几点
1、为了使录制的声音效果更加理想,通常不
要让“输入源”的声音强度过大,以避免超过
量化器范围,造成大量的失真。
2、为录音选择适当的采样频率、量化位数和
声道数。
3,Windows环境中提供的, 录音机,, 只能
录制一分钟以内的声音, 若要录制长度超过一
分钟的声音信息, 就需要选择功能更强的其他
音频处理软件 。
3.1.4 数字化音频信息的编辑与特效处理
对于数字化后的波形声音文件,可
以使用声音处理实用软件工具对其
进行剪切、连接、混合、音调升降
处理,并可以为其增加回音、频率
过滤、边缘效果等特殊效果。
3.1.5 波形文件的播放
( 1)利用 Windows 环境提供的
“录音机”直接播放后缀为,wav
的声音文件。
( 2)利用“媒体播放器”播放多
种格式的声音文件。
( 3)选择其他播放声音的软件工
具,比如,超级解霸。
3.2 MIDI与音乐合成
3.2.1 什么是 MIDI?
MIDI( Musical Instrument Digital Interface)
是乐器数字接口的英文缩写,它是指数字乐
器与计算机连接的接口,即在数字乐器与计
算机相连接时所使用的可以直接插入在计算
机串口上的一个小部件,通过它可以使数字
乐器与计算机相互“沟通”信息。
MIDI的特点 是其文件内部记录的是演奏数字
音乐的全部动作过程。比如,音色、音符、
延时、音量、力度等信息,所以其数据量相
当小。
3.2.2 音乐合成
常见的音乐合成有两种方法:
( 1) 调频合成法 ( FM合成法 )
主要通过叠加不同频率的正 ( 余 ) 弦波的方式
模拟正式的声音波形 。 其特点是开销较小, 声
音听起来比较干净, 清脆, 但失真较大 。
( 2) 波表合成法 ( Wave Table)
这种合成技术是将各种真实的乐器声音录制下
来, 并保存在一个波形表格中 。 播放时根据
MIDI文件记录的乐谱信息向波形表格发出指
令, 然后从中找出对应的声音信息, 经过合成
后回放出来 。 由于它采用的是真实乐器的采样,
所以效果自然要好于 FM。
3.3 语音识别
特征
取值
相似度
测量
建立标准样
板或模型库
形成标准
样本或模型
语音
信号
识别
结果
识别
训
练
语音识别系统的分类
语音识别按 识别对象可 分为孤立词识别,
连接词识别和连续语言识别与理解三类 。
按使用者 的适应情况, 可分为认人识别
和不认人识别两类 。 按词表大小 可分为
小词表 ( 100 个 词 以 下 ), 中词表
( 100~1000个词 ) 和大词表 ( 1000个词
以上 ) 三类 。 中, 小词表识别可用整词
作为识别单元 。 由于大词表的混淆性大
大增加, 只能用子词单元 ( 音素, 双音
素, 音节等 ), 识别难度很大 。
3.4 声音文件的基本格式
1,WAV文件,这是 Windows环境使用
的 标准波形 声音文件 格式, 扩展名
为,wav。
2,VOC文件,这是为特定音频卡设计的
文件格式, 它主要应用于 DOS环境 。
3,MIDI文件,这是记录 MIDI音乐的文
件格式, 后缀为,mid。 与波形文件相比
较, 它记录的不是实际声音信号采样的
数值, 而是演奏乐曲的动作过程及属性,
因此, 它的数据量很小 。
3.5 音频卡
,音频卡的基本功能,
( 1)录制、编辑和回放数字声音文件;
( 2) 在录制和回放声音文件时进行压缩
和解压缩, 以节省存储空间;
( 3) 采用语音合成技术, 使计算机能够
朗读书面文字;
( 4) 有乐器数字接口 (MIDI),使得计算
机可以控制多台带 MIDI接口的电子乐器;
( 5) 初步的语音识别 。
,音频卡的基本结构体系,
音效芯片
芯片组
音频
C O D EC
芯片
波表
音色库
功率放大
芯片
ISA /P C I
总线
S/ P D IF
数字信号
输入输出
模拟信号
输入输出
输入
功率信号
输出
输入
,音频卡的外部接口,
?Line-in:音频输入端口
?Microphone(MIC),用来
与话筒连接
?Line-out:用于连接外部音
频设备的输入 。
?Speaker:用于连接耳机,
无源喇叭或有源立体音箱 。
?Game Port/MIDI:用于连
接游戏操作杆或具有 MIDI
接口的电子乐器 。
,音频卡的技术指标,
1,采样频率和量化位数
2,合成芯片
3,兼容性
4,MIDI/GAME端口
5,I/O端口
6,CD-ROM接口
7,音频压缩
8,DSP芯片
9,软件支持
第 4 章
图形图像信息处理技术
图形 是指用计算机绘制的画面,
而 图像 是指由输入设备捕捉的
实际场景画面。
4.1 图像彩色空间的表示
色彩的基本概念
人们对颜色感觉的形成有四个
要素;即光源、物体、眼睛和
大脑。这四个要素不仅使人产
生颜色的感觉,而且也是人能
正确判断色彩的条件。
发射光及反射光
反射光
发射光
发光物体 呈现的颜色是由物体本身发出不同波长的
光所造成; 不发光物体 呈现的颜色是光照射物体时
被物体反射出的光所具有的。
加色法颜色 和 减色法颜色
?加色法颜色是把不同的颜色 相加 得到的
颜色。该系统中,没有任何颜色呈黑色,
全部颜色出现时呈白色。加色法系统属
于 发射光,计算机监视器采用这个系统。
?加色法采用红、绿、蓝( RGB) 三种颜
色作为基色。
?减色法所得到的颜色是减后的颜色。没
有任何颜色时呈白色,全部颜色都出现
则呈黑色。减色法利用的是 反射光 原理。
打印机采用此系统。
?反射光采用青色( Cyan)、粉红
( Magenta)及黄( Yellow)三种颜色作
为基色。由于打印墨的问题,往往需加
一些黑墨,所以真正打印机处理的是四
色。简称 CMYK。
度量色彩的三要素
色调,由可见光谱中各分量成分的波
长来确定,是彩色光的基本特性。
饱和度,是指颜色的纯度,即掺入白
光的深浅感觉。
亮度,指彩色光对人眼引起的光刺激
程度,显然它与光的能量有关。
三基色原理
红、绿、蓝三色光可以混合成自然界的
全部色彩,而这三色光本身相互独立,
所以人们常常将红、绿、蓝称为色光三
原色。从生理学上讲:人们眼睛的视网
膜上存在着三种不同类型的锥体细胞,
它们分别对红、绿、蓝有很高的灵敏度
(对不同波长有不同的灵敏度),物体
反射光进入人眼睛以后,在三种锥体细
胞的作用下,产生不同颜色的光感。这
就是三刺激理论,又称三色学说理论。
色彩模型
,HSB 模型,
HSB 是艺术家习惯采用的颜色描述方法。
?Hue:色调
?Saturation:饱和度
?Brightness:亮度
,RGB模型,
自然界中绝大多数的色彩都可以用
适当比例的三基原色混合组成的等
效色来模拟。
红 +绿 =黄
红 +蓝 =品红
绿 +蓝 =青
红 +绿 +蓝 =白
红
绿 蓝
黄
青
品红
白
,CMY模型,
用彩色墨水或颜料进行混合,得到的颜色被称为
减法色。从理论上说,任何一种颜色都可以用三
种基本颜料按一定比例混合而成。这三种颜色是
红、绿、蓝色的补色,
即青 (Cyan)、品红
(Magenta)和黄色
(Yellow),通常写
成 CMY。
红
绿蓝
黄
青
品红
黑
,YUV模型,
这是一种电视系统使用的色彩表示形式。
其中 Y表示亮度,U,V表示色差。所谓
色差是指三原色信号分量与亮度信号之
差。其特点:
?可以使黑白电视和彩色电视兼容
?可以利用人眼对彩色的敏感度低于对亮度的
敏感度的视觉特性,将 UV信息用较少的二
进制位数表示,较窄的频带传送
人的视觉特性
?人眼对亮度的敏感程度与周围环境的亮
度有关。背景亮度越高、变化越剧烈,
人眼对亮度的灵敏度越低。
?当空间亮度的变化频率在 3~4.5周 /度时
(从某一观察点来看,亮度信号在单位
视角内变化的周期数),视觉的对比度
灵敏度最高,即人眼对这些空间频率的
分辨能力最强;当空间频率高于 50~60周
/度时,人眼就很难分辨了
,位图图像与矢量图形的特点,
位图图像,由数字阵列信息组成,阵列中的各项数
字用来描述构成图像的各个点( 像素 )的强度与颜
色等信息。
矢量图像,用一组指令集合来描述图形的内容,这
些指令用来描述构成该图形的所有直线、圆、矩形
等图元。
4.2 位图图像与矢量图形
位图图像中的颜色
(灰度)值 为两个
等级时,称之为 二
值图像 。
否则称为 彩色(灰
度)图像 。图像的
颜色(灰度)等级
越多,就越逼真。
位图图像
位图的优缺点
优点,自然、直观,容易描述细节内容,
并可进行特殊效果的处理。
缺点,数据量大,耗费存储。进行图像
的放大、缩小和旋转等编辑处理较困难。
矢量图形举例
矢量图形的优缺点
优点,适用于绘制简单的图形,占内存小,
颜色数不影响文件的大小,易对个别图元进
行编辑,放大缩小后输出的图形不失真。
缺点,对于复杂图形,矢量命令会变得复杂,
创建的图形不自然。由于矢量图形依赖于简
单的图元,所以很难表现物体的复杂属性。
矢量图形与位图的关系
?矢量图形 的基本元素是图元
位图 概念的基本元素是像素。
?矢量图形 的显示过程是依照图元绘制
的顺序显示;
位图 的显示过程按照位图中安排的像素
顺序显示,往往是从上到下,从左到右。
矢量图形与位图的关系
?矢量图形可进行变换,无失真。
图像变换会失真。
?矢量图形可以图元为单位单独进行属
性修改编辑等操作,而位图不行。
?矢量图形实际上是对位图的抽象。
? 分辨率
–屏幕分辨率:指显示屏幕上的最
大显示区域,即水平和垂直方向
的像素个数
–图像分辨率:指数字图像的尺寸,
即水平和垂直方向的像素个数
图像的主要属性
?颜色深度
位图矩阵中表示每个像素颜色的二进制
位数 称为 位深度 。
常见的彩色或灰度图像 位深度 有:
4位( 24) 16色
8位( 28) 256色
16位( 216=65536) 增强色
24位( 224=16777216) 真彩色
,图形的获取方式,
? 利用软件绘图图形
? 利用数字化仪绘制图形
? 利用光笔绘制图形
,图像的获取方式,
利用扫描仪、数字摄象机等图像采集设备获
取图像
4.3 图形图像的获取及表现
,图形图像的表现,
呈现图形图像的主要设备有两类:
光栅扫描显示和硬拷贝设备 。 目前,
使用的主要光栅扫描显示部件是阴
极射线管 ( CRT), 图像打印机是
典型的硬拷贝设备 。
我们将图像采集到计算机中,常常并不
直接使用,而是先要对其进行修版、编
辑等处理。这就需要对原始的数字图像
进行大量的操作。常见的操作有:图像
几何运算、图像增强、图像复原和重建、
图像分割和特征提取、图像编码和压缩
等。
4.4 图像的加工处理
,图像几何运算,
图像几何运算包括对图像进行缩放、剪贴、平
移、旋转和变形等操作。
,图像增强,
所谓图像增强是指增强图像中有用的信息,压
低噪音,其目的主要有两个:一是处理原始图
像使它更清晰、更适于人的观察;二是变换图
像以方便人或机器的分析和处理。
在成像过程中, 由于成像系统本身或噪音等多种
因素的影响使图像变得模糊的现象叫 图像退化 。
分析和了解图像退化现象及其原因, 建立退化
过程的数学模型是进行图像复原的必要条件 。
所谓 图像复原 就是对退化或劣化的图像进行校
正处理, 滤去退化痕迹, 恢复图像的本来面目 。
其原则应是尽可能复现或逼近无退化的真实图
像 。
,图像复原和重建,
,图像分割和特征提取,
?图像分割是将图像分割成不同的部
分或区域的过程 。 图像分割是对图
像进行处理, 分析及理解的一个重
要基础操作 。 其目的是把图像分成
一些有用的或有意义的部分或区域,
以便进一步对图像进行分析与理解 。
?图像特征提取就是检测和提取图像
的特征 。
,图像编码与压缩,
多媒体数据量极大,为了存储、传
输和实时处理这些数据必须进行有
效地压缩,只有这样才有可能播放
出高质量的视频、音频。
? 640*480分辨率 24位真彩色图像数据量约
为 900KB;
? NTSC标准的 帧速率 为 30帧 /s,视频信号
要求传输率为 26.4MB/s;
? 采样频率为 44.1kHz,量化位数为 16,双
通道立体声,100MB仅能存储约 10分钟。
多媒体数据压缩的可能性
多媒体数据的特点:
数据量 =信息量 +数据冗余
数据冗余类型:
空间冗余、时间冗余、信息熵冗余、
结构冗余、知识冗余、视觉冗余
多媒体数据存在着大量的 冗余,这使
得数据压缩成为可能。数据压缩技术
实际上就是研究如何利用数据的冗余
性来减少数据量的方法。
衡量数据压缩方法好坏的标准
?压缩比尽可能地大
?压缩算法的简单性,以及压缩、解
压缩的速度,尽可能实现实时压缩
?复原效果好
数据压缩的分类
数据压缩是由两个过程组成的:
?编码过程:压缩
?解码过程:解压
?按失真性分为
?无损压缩
?有损压缩
?无损压缩:利用数据的统计统计冗余进行
压缩,可完全恢复原始数据而不引入任何
失真,但压缩比较小,一般在 2,1到 5,1
之间。这类方法广泛应用于文本数据、程
序。有代表性的算法是:游程编码、
Huffman编码、算术编码等等。
?有损压缩:利用人类视觉和听觉器官对
图像或声音中的某些频率成分不敏感的
特性,允许在压缩过程中损失一定的信
息;虽然不能完全恢复原始数据,但所
损失的部分对理解原始图像或声音不会
产生影响。有代表性的算法有,PCM、
预测编码、变换编码、插值等等。
压缩的主要过程
? 取样 是将连续的模拟信号变成离散的数字信号
过程,即时间轴上的离散化;
? 量化 是将幅度轴上的模拟信号离散化的过程;
? 编码 是将离散化后的数字用二进制码表示的过
程。
取样 量化 编码
t
V
视频编码的国际标准
1。静止图像压缩标准 JPEG
Joint Photographic Experts Group
“多灰度静止图像的数字压缩编码,
它是一个适用于彩色和单色多灰度或
连续色调静止数字图像的 压缩标准 。
它包括无损压缩和有损压缩两部分。
有损压缩的压缩比可达到 20~40倍。
基于 DCT 的编码过程
DCT
正变换
量化编码器 熵编码器
表说明表说明
压缩后的
图像数据
源图像数据
8 × 8 块
2。运动图像压缩标准 MPEG
Moving Pictures Experts Group
MPEG-I:针对传输率为 1Mbit/s~1.5M bit/s
的普通电视质量的视频信号的压缩
MPEG-II:针对每秒 30帧的 720*572分辨率
的视频信号进行压缩
MPEG标准包括,MPEG视频,MPEG音频
和视频音频同步三部分 。
4.5 图形图像的文件格式
?PCX格式:由 Z-Soft公司设计。最初只支持 16种
颜色,现在可以支持 256色甚至真彩色图像。使
用游程长编码方法压缩,压缩比适中,速度较
快。
?BMP和 DIB格式:是 Windows 所使用的与设备
无关的点位图文件存储格式。 BMP文件有压缩
和非压缩。支持各种颜色。
?GIF格式:全称是“图形交换文件
格式”( Graphics Interchange
Format)由 CompuServe开发,可支
持黑白,16色和 256色的彩色图像,
采用 IZW压缩算法,压缩比高。
?TIF格式:由 Aldus和 Microsoft合作
开发。最初用于扫描仪和桌面出版
业。分为压缩和非压缩两种。
?JPG和 PIC格式:是 Apple Mac机器
上使用的格式。最大特点是文件非
常小,而且可以调整压缩比,但显
示较慢,有一定的失真。
?PCD格式:是 Kodak开发的照片文
件格式,是 Photo-CD的专用存储格
式,一般存储在 CD-ROM上,读取
需要 Kodak提供的专门软件。
4.6 显示系统及数字像机
?显示系统负责计算机的所有显示输出, 它主要
由 显示器 和 显示适配器 组成 。
?显示器的英文名称是 Monitor,, 监视器,,
其作用是将主机发出的信号经过一系列处理后
转换成光信号, 最后在屏幕上显示出各种文字,
图形, 图像等信息 。
?目前市场上的显示器主要有两类:一类是 CRT
显示器;另一类是 LCD显示器, LCD具有许多
优点, 它占空间小, 低功耗, 低辐射, 无闪烁,
可以降低视觉疲劳, 但是, 价格偏高一些, 因
此目前使用比较广泛的还是 CRT显示器 。
CRT显示器的工作原理
CRT显示器的核心部件是显像管, 它直接决定
了显示器的价格, 性能和显示质量 。 它的 基本
工作原理 是将显像管内部的电子枪阴极发出的
大量电子束, 经过强度控制, 聚焦和加速, 形
成很细的电子流, 再经过偏转线圈的控制作用,
高速, 定点地去轰击荧光屏 。 荧光屏上的荧光
粉经过电子的轰击发出亮光 。 荧光屏上的每一
点 ( 像素 ) 都是由红, 绿, 蓝三原色组合而成,
电子枪发出的三束电子汇聚荫罩板的小孔或狭
缝中, 穿过荫罩板后按不同强度比例点亮荧光
粉从而合成各种颜色 。
选购显示器应注意的几个指标
?显示器的尺寸,应该适当地大一些 。
?点距,是指显像管两个最接近的同色荧光点之
间的直线距离, 在显示屏幕大小一定的条件下,
点距越小越好 。 常见的有 0.25mm和 0.28mm。
?带宽,是指特定电子装置能够处理的频率范围 。
带宽越高, 高频处理能力越强, 图像越清晰 。
?刷新频率,是指显示屏幕刷新的速度 。 刷新频
率越高, 图像显示的稳定性越好 。
?辐射和环保,获得低辐射认证 。
显示视配器
图形处理器芯片
R A M D A C
显示缓存
B I O S
总线接口
外部接口
数字像机
数字相机是一种新型的图像输入设备,
它与普通照相机的主要区别有两点:
1,是存储的照片不是实际的影像, 而是
一个个数字文件;
2,是存储体不是传统的胶卷, 而是数字
化存储片 。
其特点有:由于每张照片以数字文件的
形式存储, 所以可直接导入计算机中,
以便利用计算机对其进行加工, 展示,
永久性保存, 并且具有保留时间长, 质
量高, 可以无损坏地无限次复制等优点 。
第 5 章
视频信息处理技术
什么是“视频”?
视频动态图像是由多幅连续的单帧图
像序列构成的,当每一帧图像为实时
获取的自然景物或活动对象时,称之
为 动态影像视频,简称动态视频或视
频( Video)。
数字视频
数字视频就是对模拟视频信号进行
数字化后的产物。我们家中的电视
机、收录机处理的都是模拟信号。
模拟信号在时间和幅度上具有连续
性,它是基于模拟技术以及图像显
示的国际标准来产生视频画面的。
它具有成本低、还原性好等优点,
因此,我们从电视机中看到的大自
然风景会让你具有身临其境的感觉。
数字视频的优点
?可无限复制而不失真
?可进行视频编辑,创意
?可将视频溶进计算机环境
几个概念
?电视扫描
?长宽比例
?同步信号
?水平分辨率
?垂直分辨率
?扫描频率
电视制式
所谓电视制式,实际上是一种电视
显示的标准。不同的制式,对视频
信号的解码方式、色彩处理的方式
以及屏幕扫描频率的要求都有所不
同,因此如果计算机系统处理的视
频信号的制式与连接的视频设备的
制式不同,在播放时,图像的效果
就会有明显下降,甚至根本无法播
放 。
NTSC制式
NTSC 是 Notional Television System
Committe的缩写, 译为国家电视制式委
员会 。 它是 1953年美国研制成功的一种
兼容的彩色电视制式 。 它规定每秒 30帧,
每帧 526行, 水平分辨率为 240~400个像
素点, 隔行扫描, 扫描频率 60Hz,宽高
比例 4:3。 北美, 日本等一些国家使用这
种制式 。
PAL制式
PAL是 phase Alternate Line的缩写,
译为相位逐行交换。它是前联邦德
国 1962年制定的一种电视制式。它
规定每秒 25帧,每帧 625行,水平分
辨率为 240~400个像素点,隔行扫描,
扫描频率 50Hz,宽高比例 4:3。我国
和西欧大部分国家都使用这种制式。
SECAM制式
SECAM是 Sequential Color Memory
System的缩写,译为顺序传送彩色存储。
它是法国于 1965年提出的一种标准。它
规定每秒 25帧,每帧 625行,隔行扫描,
扫描频率为 50Hz,宽高比例 4:3。上述指
标均与 PAL制式相同,不同点主要在于
色度信号的处理上。法国、俄罗斯、非
洲地区使用这种制式。
HDTV
HDTV是 High Definition TV的缩写,
译为高清晰度电视 。 它是目前正在
蓬勃发展的电视标准, 尚无完全统
一, 但一般认为:宽高比例 16:9,
每帧扫描在 1000行以上, 采用逐行
扫描方式, 有较高扫描频率, 传送
信号全部数字化 。
全屏幕视频
全屏幕视频是指显示的视频图像充
满整个屏幕,因此它与显示分辨率
有关,对于标准 VGA全屏幕意味着
640?480分辨率,而对于 Super VGA
则可以是 800?600或 1024?768等分辨
率。在 Windows环境中,提供了播
放视频文件默认窗口大小的设置。
全运动视频
全运动视频是指以每秒 30帧的
速度刷新画面,只有到达这个
速度,才不会产生闪烁和不连
贯的现象。
动态图像数据的特点
?动态图像具有时间连续性,故非
常适合于表示“过程”;
?数据量大;
?动态图像的帧与帧之间具有很强
的相关性 ;
?动态图像对实时性要求得很高
视频信号的获取方法
摄象机
录象机
电视机
模拟视
频信号 压
缩
存
储
数字视
频信号
视频卡
A/D
视频信息的处理
对视频信息可以实施的编辑操作包
括剪切、复制、粘贴片断,与音频
片段合成,调整叠加透明度,增加
场景过渡特技,滤镜效果、叠加字
幕等。
视频文件的格式
?AVI文件格式,AVI是 Audio Video
Interleaved的缩写
?MOV文件格式,MOV文件格式是 Quick
Time视频处理软件所选用的视频文件格
式
?MPG文件格式:是采用 MPEG方法进行
压缩的全运动视频图像文件格式
?DAT文件格式:是 VCD和卡拉 OK CD数
据文件的扩展名,也是基于 MPEG压缩
方法的一种文件格式
视频卡
所谓视频卡就是 PC机上用于处理视
频信息的设备卡,其主要功能是将
模拟视频信号转换成数字化视频信
号或将数字信号转换成模拟信号。
视频卡的分类
? 视频采集卡,用于将摄像机, 录像机等设备播
放的模拟视频信号经过数字化采集到计算机中;
? 压缩 /解压缩卡,用于将静止和动态的图像按照
JPEG/MPEG标准进行压缩或还原;
? 视频输出卡,用于将计算机中加工处理的视频
信息转换编码, 并输出到电视机等设备上;
? 电视接收卡,用于将电视机中的节目通过该设
备卡的转换处理, 在计算机的显示器上播放 。
视频卡的基本功能
? 在一个可移动, 可改变尺寸的窗口中显
示全活动的数字化影像画面;
? 来自录像机, 视盘机, 摄像机和广播电
视的影像信号可在计算机上播放, 定格,
存储, 处理, 并可输出到其他的显示器
上;
? 在影像画面上可叠加计算机文字与图像;
? 可以调节色调饱和度, 亮度和对比度 。
第 6 章
CD-ROM技术
6.1 存储技术
?光存储技术
通过光技术对数据进行读写。由
于使用的是激光,因而对应的存
储介质 --盘 称作光盘。
?磁存储技术
利用磁技术对数据进行读写。对
应的存储介质为磁盘,磁带等。
存储原理
物理单元之所以能够存储数据,是
因为它的某种 性质 能够发生 变化,
以此反映出所存储的数据。通过识
别这种性质上的变化,可 读出 数据,
而用某种编码方法改变性质则可将
数据 写入 介质。
磁存储介质的优缺点
存储密度高、易于读写,但长期保
存也存在着风险性,气候环境、磁
环境、人为因素都有可能破坏磁记
录,造成不可挽回的损失。
光盘系统
光盘系统是由 光盘驱动器 和
光盘片 组成。驱动器是用于
读 /写信息的设备,而光盘片
是用于存储信息的介质。
光盘片结构
激光束
基片(PC)
介质层(SiO)
磁光膜(TbFeCo)
反射膜(Al)
介质层(SiN)
光盘驱动器的分类
?只读光盘 (CD-ROM)
?一次写多次读光盘 (CD-
R,WORM)
?可重写光盘
光存储介质特点
?密度高,存储容量大
?采用非接触方式读 /写信息
? 能自由更换光盘
? 不易划伤
? 无磨损
? 可长期保存信息
光盘容量
分,0~73
秒,0~59 地址
扇区号,0~74 每秒划分成 75个扇区
333000(扇区 )*2048(字节 /扇区 )
=681984000(字节 )
1M=1048756 共 650M
使用光盘应注意的地方
?忌将光盘夹在书中
?忌将不干净的或变形的光盘放如 CD-
ROM驱动器
?忌在光盘上贴标签、用笔书写
?忌强行取出
?忌日晒
?忌触摸光盘表面
?忌用有油渍、污垢的手拿光盘
光盘的 ISO标准 ——红皮书
CD Audio 激光唱盘标准由
荷兰 Philips公司和日本 Sony
公司共同制订内容为记录 音
频 的标准。
光盘的 ISO标准 ——黄皮书
CD-ROM标准由荷兰 Philips
公司和日本 Sony公司等几家
公司共同制订规定了 CD盘上
记录数据 的方式。
光盘的 ISO标准 ——绿皮书
CD-I交互式光盘 标准为面向
教育或家庭娱乐应用的 CD-
ROM制订的可将音频,文本
和图像混合存储在 CD盘上。
光盘的 ISO标准 ——白皮书
用于存放视频图像和电影。该
标准使用 MPEG压缩技术可在
普通的 CD-ROM盘上存储 74分
钟的全动态视频图像和 CD音质
的同步声音。
光盘的 ISO标准 ——橙皮书
可写入光盘标准。
根据这个标准将数据一次或
多次写入空白的 CD 盘。
6.2 CD-ROM驱动器
光盘驱动器可以分为,CD-ROM
( 只读光盘驱动器 ), CD-R( 可写
光盘驱动器 ), CD-R/W( 可擦写光
盘驱动器 ), DVD-ROM( DVD只
读光盘驱动器 ), DVD-RAM( 可
反复擦写 DVD光盘存储器 ) 。
CD-ROM驱动器的外观
耳机插孔
强制弹出孔
音量调节按钮 指示灯
播放/向 后搜索键
打开/关 闭/停 止键
光盘托架
光驱的背面
电源插座数据线插座盘模式跳线数字音频输
出连接口
模拟音频输出连接口
C
S
E
L
S
L
A
V
E
M
A
S
T
E
R
CD-ROM驱动器的内部结构
电机
读
取
聚
焦
伺
服
跟
踪
伺
服
速
度
伺
服
微处理器
光盘片
光学头
g u a n g x u
e t o u
CD-ROM驱动器的工作原理
光盘片
物镜
半反射棱镜
激光发生器
光敏元件
光盘及驱动器的主要指标
? 存储容量
存储的数据量 (字节 )
? 数据传输率
驱动器将数据从 CD-ROM传送
到系统存储器的速度。单速为
150KB/S。
驱动器性能指标
? 平均存取时间
驱动器在盘上定位、存取一段需
要的信息所用的时间
? 高速缓存
暂存读入的数据 (64K,256K,512K)
? 接口标准
– IDE接口,SCSI接口
驱动器性能指标
? 旋转方式
(1)恒定线速度 ( Constant Linear Velocity,
简称 CLV) 方式
(2) 恒 定 角 速 度 ( Constant Angular
Velocity,简称 CAV) 方式
(3)局部恒定角速度 PCAV
? 纠错能力
? CPU占用率
6.3 光盘驱动器的安装
1,调整主从跳线
2,固定驱动器于安装架上
3,安装 CD-ROM驱动器数据线
4,CD-ROM驱动器电源线的连接
5,CD-ROM驱动器音频线的连接
6、安装驱动程序
6.4 CD-ROM盘的制作过程
预处理 制作母盘 复制
6.5 DVD技术
DVD是,Digital Video Disc”的缩写,中文名
称为“数字视频光盘”。 DVD有以下优点:
?容量大, 单面单层光盘容量高达 4.7GB,双面
双层光盘容量高达 17GB;
?视频图像质量好;
?采用 Dolby Digital格式, 通过 Dolby AC-3系统
的 5.1声道设计, 能够产生 5个声道的高品质环
绕立体声;
?可以兼容已有的 CD-Audio,CD-ROM,CD-R
等多种格式的光盘, 性能价格比高 。
DVD产品的品种
?DVD-ROM
?DVD-R
?DVD-RW
?DVD-RAM
DVD盘片
DVD的碟片的大小与 CD-ROM相同, 由
两个厚 0.6mm的基层粘成, 最大的特点
之一在于可以单面存储, 也可以双面存
储, 所以 DVD的碟片分为四种:单面单
层 ( DVD-5) 容量为 4.7GB,单面双层
( DVD-10) 容量为 9.4GB,单面双层
( DVD-9 ) 容量为 8.5GB, 双面双层
( DVD-18) 容量为 17GB。
DVD-ROM驱动器的倍速
与 CD-ROM驱动器类似,DVD-
ROM的倍速也是用来简单衡量
DVD-ROM驱动器速度的一个指标,
但 DVD-ROM驱动器的倍速并不等
于 CD-ROM驱动器的倍速。对 DVD-
ROM驱动器来说,一个倍速约为
CD-ROM驱动器的 9倍。而对一些
DVD-ROM驱动器来说,标识的倍
速实际上只是最大倍速。
防盗版措施
为了防止盗版现象的出现,DVD
采用了分区制。即将全球分为 6个
区域,规定各个区域的 DVD机只
能播放区号相同的 DVD碟片。我
国为第 6区。
DVD-ROM驱动器的光头
目前的 DVD-ROM驱动器,有单激
光头和双激光头之分。单激光头也
就是用同一个光头读取 DVD和 CD-
ROM信号,双激光头是分别用两个
光头读取 DVD和 CD-ROM信号。有
人认为单激光头较易损耗,而双激
光头可靠性较好。
第 7 章
多媒体应用系统的开发
7.1 多媒体应用系统
多媒体应用系统就是 为了某个特定目的, 使
用多媒体技术开发研制的应用系统, 又称为
多媒体应用软件, 是多媒体应用的最终产品,
其功能和表现是多媒体技术的直接体现 。 典
型的应用系统有:多媒体教学软件系统, 多
媒体电子出版物, 多媒体数据库应用系统,
多媒体通信, 视听会议系统, 游戏等等 。
多媒体辅助教学软件
Computer Assisted Instruction
( CAI) 计算机辅助教学
指用计算机帮助教师进行教学或用计
算机进行教学的应用领域。它是计算
机科学、教育学、心理学等多门学科
交叉形成的一门综合性新兴学科。
多媒体辅助教学软件的特点
?个别性
?交互性
?灵活性
?多样性
?商品化
多媒体辅助教学软件的教学模式
?作为课堂演示模式
?个别交互模式
?训练复习模式
?资料工具模式
?教学游戏模式
多媒体辅助教学软件的基本任务
? 正确和生动地表达本学科的知识内容
? 反映本学科的教学过程和教学策略
? 学生和计算机进行信息交换的交互界面
? 问题的判断和学习指导
? 反馈功能
? 制定下一步的学习计划
多媒体辅助教学软件的制作过程
?需求分析
?编写脚本
?制作
需求分析阶段
?总体任务,弄清要达到的目标,明
确给出达到目标的评估指标。
?具体任务,确定教学目标;建立教
学内容的知识结构;明确使用对象
编写脚本
? 目的:脚本是多媒体教学软件设计思想的具体体
现;是制作过程的直接依据;是沟通学科教师与
软件开发人员的有效工具。
? 脚本包含两部分内容:
– 文字脚本:按照教学过程的先后顺序,用于描述每一
环节的教学内容及其呈现方式的一种形式。
– 制作脚本:体现软件的系统结构和教学功能,通常包
含系统结构说明,知识单元的分析,屏幕设计,链接
关系,制作脚本卡片等
制作过程中应注意的问题
?软件脚本的创作非常重要
?选择一个合适的多媒体制作工具
?发挥多媒体的优势
?强调交互性
?使用超文本结构
?友好的人机界面
?文档齐全
多媒体电子出版物
多媒体电子出版物是把多媒体信
息经过精心组织、编辑及存储在
光盘上的一种电子图书。
出版物的分类
? 传统的出版物
? 以缩微胶片、录音带、录像带等为
代表的非纸面出版物
? 以电、磁、光等为信息载体的数字
信息存储形式的电子出版物
多媒体电子出版物
以图、文、声、像等多种形式表现并且
由计算机及其网络对这些信息以内在的
统一方式进行存储、传送、处理及再利
用的电子出版物被称为多媒体电子出版
物。
多媒体电子出版物
? 包括电子图书、电子期刊、电子新闻报纸、电
子手册与说明书、电子公文或文献、电子图画、
广告、电子声像制品。
? 根据 发行方式 分类电子网络出版和单行电子期
刊
? 根据 形式 分为联机数据库、电子报刊及电子图
书
? 根据 内容 分为教育类、娱乐类及工具类
多媒体电子出版物的特点
?存储容量大
?媒体种类多
?运输与携带方便
?可长期保存
?传播及时
?价格低廉
多媒体电子出版物的制作流程
选题 ?编写脚本 ?准备媒体数据 ?
系统制作 ?调试 ? 测试 ?优化 ?
产品生产 ?发行
多媒体电子出版物的制作特点
?制作人员是由包括非计算机专业人员在
内的各类人员的组合。
?运用各种媒体数据的准备工具,并通过
多媒体创作工具进行集成。
?多媒体技术、超媒体技术和全文检索技
术是主要的支持技术。
开发小组成员组成
?媒体素材制作员
?主题专家、脚本设计人员
?美术音乐设计和创意人员
?创作人员
?软件和计算机维护人员
制作系统环境的要求
?具有录入文字、处理图形图像、动画制
作、视频处理、音频处理及创作编辑能力。
?硬件环境:多媒体计算机、扫描仪、数
字相机 …
?软件环境:多媒体操作系统、处理加工
各种媒体的软件工具及集成软件。
注意事项
? 熟练掌握各种多媒体著作工具,充分认
识其软件功能的“弹性”特点。
? 努力提高多媒体资源的数字化水平,严
把质量关。
? 参考、交流第三方光盘,吸取他人成功
的经验和失败的教训
? 严格进行光盘测试,保证光盘质量
? 聘请主题专家,严把脚本质量关
多媒体数据库
多媒体数据类型:
–字符数值
–文本数据
–图像数据
–音频数据
–视频数据
–动画数据
多媒体数据对数据库的影响
– 数据量大
– 媒体数据种类多
– 改变数据库的操作形式
– 处理长事物的能力
理想的多媒体数据库系统的要求
– 支持图像、动画、声音、视频、文本等多媒体字
段类型及用户定义的特殊类型
– 支持定长数据和非定长数据的集成管理
– 支持复杂实体的表示和处理
– 支持同一实体的多种表现形式
– 具有良好的用户界面
– 支持多媒体的特殊查询及良好的处理接口
– 支持分布式环境
多媒体数据库系统的关键技术
– 数据模型技术
– 数据的存储管理与压缩 /解压缩技术
– 多媒体信息的统一
– 多媒体信息的再现及良好的用户界面
– 多媒体信息的检索
– 分布式环境与并行处理技术
– 并行数据库系统
7.2 多媒体应用系统的开发
多媒体应用系统与其他应用系统相
比较具有下列主要特点:
1,多媒体应用系统的开发环境复杂 。
2,所涉及到的数据类型繁多 。
3,系统要求具有良好地交互性 。
4,开发过程需要各种技术人才 。
多媒体软件开发组
一个完整的多媒体项目的开发小
组需要包含下面几类人员:
( 1) 项目经理
( 2) 多媒体设计师
( 3) 写作专家
( 4) 视频专家
( 5) 音频专家
( 6) 多媒体程序员
多媒体应用系统的开发过程
?概念阶段:明确将要开发的系统做什么?
?设计阶段:确定将要开发的系统如何做?
?准备素材阶段:采集, 编辑项目中所需要的全
部数据 。
?集成阶段:构建项目的整体框架, 把各种表现
形式集成起来并加入一些交互特征 。
?测试阶段:运行并检测应用系统 。
?发行阶段:最后制作发行版本, 编写用户使用
手册, 最终发行到用户手中 。
概念 设计 素材 集成 测试 发行
7.3 多媒体著作工具
多媒体创作是指充分运用计算
机的综合交互功能,将文字、
声音、图形、图像、动画和视
频等多媒体信息组织和编辑成
一个有机的整体,从而为某个
目标服务。
多媒体创作
多媒体创作系统是指一套用
于创作多媒体应用程序的软
件工具。 创作工具 则是在创
作应用程序时可完成多项任
务的计算机程序。
商品化软件工具
电子表格
字处理
数据库
...
创作系统
集成工具
绘图工具
音频捕捉 /编辑工具
视频捕获 /编辑工具
CPU 海量存储器
内存 视频卡
显示器 音频卡
键盘 扬声器
鼠标 …,..
操作系统
创作工具的评价标准
?编程环境
?超媒体功能和流程控制功能
?支持多种媒体数据输入和输出
?动画制作与演播
?应用程序间的动态链接
?制作片段的模块和面向对象化
?界面友好、易学易用
?良好的扩充性
集成工具的分类
?以图标为基础,Authorware
?以时间为基础,Director
?以页为基础,PowerPoint
?以程序设计语言为基础
界面设计的原则
?面向用户的原则
?简洁性原则
?适当性原则
?顺序性原则
?一致性原则
?合理选择文本和图形
?合理使用颜色