? 理解多媒体、多媒体技术的概念
? 明确多媒体中的主要元素及其特点
? 了解多媒体的关键特性以及这些特
性之间的关系
? 了解多媒体的关键技术、主要应用
领域和发展方向
? 了解多媒体数据中的冗余以及几种
主要压缩算法
学习目标
1.1 多媒体的基本概念
1.2 多媒体技术的应用与发展
1.3 多媒体的关键技术
1.4 多媒体信息的计算机表示
1.5 多媒体数据压缩技术
1.6 多媒体与因特网
目录
1.1 多媒体的基本概念
1.1.1 多媒体的定义
1.1.2 多媒体技术及其特性
1.1.3 多媒体中的媒体元素及其特征
1.1.1 多媒体的定义
“多媒体, 一词译自英文, Multimedia”
即, Multiple”和, Media”的合成
其核心词是 媒体
何谓多媒体呢?
媒质,存储信息的实体,如磁盘、
光盘、磁带、半导体存储器等。
媒介,传递信息的载体,如数字、
文字、声音、图形和图像等。
媒体 ( medium)在计算机领域有
两种含义:即 媒质 和 媒介 。
通常概念的, 媒体,,可分为以下
五种类型:
感觉媒体
表示媒体
显示媒体
存储媒体
传输媒体
感觉媒体,能直接作用于人们的
感觉器官,从而能使人产生直接感觉
的媒体。如语音、音乐、各种图像、
动画、文本等。
表示媒体,为了传送感觉媒体而
人为研究出来的媒体。借助于此种媒
体,便能更有效的存储或传送感觉媒
体。如语言编码、电报码等。
显示媒体,用于通信中使电信号和
感觉媒体之间产生转换用的媒体。如输
入、输出设施,键盘鼠标器、显示器、
打印机等。
存储媒体,用于存放某种媒体的媒
体如纸张、磁带、磁盘、光盘等。
传输媒体,用于传输某些媒体的媒
体,如电话线、电缆光纤等。
多媒体计算机技术的 定义,
计算机综合处理多种媒体信息,文本
图形、图像、音频和视频,使多种信息建
立逻辑连接,集成为一个系统并具有交互
性。
1.1.2 计算机技术及其特性
多媒体计算机技术的三个主要 特性
信息载体的多样性
交互性 集成性
信息载体的多样性 是相对于计算机
而言的,即指信息媒体的多样性。
多媒体就是要把计算机处理的信息
多样化或多维化,从而改变计算机信息
处理的单一模式,使人们能交互的处理
多种信息。
信息载体的多样性
交互性
多媒体的 交互性 是指用户可以与
计算机的多种信息媒体进行交互操作
从而为用户提供了更加有效地控制和
使用信息的手段。
集成性
集成性 是指以计算机为中心综合处
理多种信息媒体,它包括信息媒体的集
成和处理这些媒体的设备的集成。
信息媒体的集成 包括信息的多通道
统一获取、多媒体信息的统一组织和存
储、多媒体信息表现合成等方面。
多媒体设备的集成 包括硬件和软件
两个方面。
多媒体媒体元素是指多媒体应用中
可显示给用户的媒体组成。
1.1.3 多媒体中的媒体元素及特征
音频
动画
视频
文本 图形 图像
文本
文本分为非格式化文本文件和格式
化文本文件。
非格式化文本文件:只有文本信息
没有其他任何有关格式信息的文件,又
称为纯文本文件。如,,TXT,文件。
格式化文本文件:带有各种文本排
版信息等格式信息的文本文件。
如,,DOC,文件。
图形
图形( Graphic)一般指用计算机绘
制的画面,如直线、圆、圆弧、矩形、
任意曲线和图表等。
图形的格式是一组描述点、线、面
等几何图形的大小、形状及其位置、维
数的指令集合。
在图形文件中只记录生成图的算法
和图上的某些特征点,因此也称 矢量图 。
用于产生和编辑矢量图形的程序通
常称为, draw,程序。
微机上常用的矢量图形文件有:
,.3DS”(用于 3D 造型),,.DXF”(用于
CAD),,.WMF”(用于桌面出版)等等。
由于图形只保存算法和特征点,因
此占用的存储空间很小。但显示时需经
过重新计算,因而显示速度相对慢些。
图像
图像( Image)是指由输入设备捕捉的
实际场景画面,或以数字化形式存储的任
意画面。
静止的图像是一个矩阵,阵列中的各
项数字用来描述构成图像的各个点(称为
像素点 pixel )的强度与颜色等信息。这种
图像也称为 位图 ( bit-mapped picture )。
用于生成和编辑位图图像的软件通
常称为, paint, 程序。
图像文件在计算机中的存储格式有
多种,如 BMP,PCX,TIF,TGA,GIF、
JPG 等,一般数据量都较大。
图像处理时要考虑三个因素:
分辨率
图像深度与显示深度
图像文件大小
分辨率
屏幕分辨率,显示器屏幕上的最大显示
区域,即水平与垂直方向
的像素个数。
图像分辨率,数字化图像的大小,即该
图像的水平与垂直方向的
像素个数。
像素分辨率,像素的宽和高之比一般为
1:1。
图像深度和显示深度
图像深度 (也称图像灰度、颜色深度)
表示数字位图图像中每个像素上用于表示颜
色的二进制数字位数。
显示深度,表示显示器上每个点用于显
示颜色的 2 进制数字位数。
若显示器的显示深度小于数字图像的深
度,就会使数字图像颜色的显示失真。
颜色深度 颜色总数 图像名称
1 2 单色图像
4 16 索引 16 色图像
8 256 索引 256 色图像
16 65536 HI— Color 图像
24 16672216 True Color 图像
颜色深度与显示的颜色数目
图像文件大小
用字节表示图像文件大小时,一幅未经
压缩的数字图像的数据量大小计算如下:
图像数据量大小 = 像素总数 × 图像深度 ÷ 8
例如,一幅 640× 480 的 256 色图像为
640× 480× 8/ 8 = 307200 字节
Comparison:
宽度,271
高度,300
颜色,2
大小,9.9 KB
宽度,271
高度,300
颜色,4
大小,19.8 KB
Comparison:
宽度,271
高度,300
颜色,256
大小,79.4 KB
宽度,271
高度,300
颜色:真彩色
大小,238.2 KB
音频
数字音频( Audio)可分为 波形声音
语音 和 音乐 。
波形声音 实际上已经包含了所有的
声音形式,它可以将任何声音都进行采
样量化,相应的文件格式是 WAV 文件或
VOC文件。
语音 也是一种波形,所以和波形声
音的文件格式相同。
音乐 是符号化了的声音,乐谱可转
变为符号媒体形式。对应的文件格式是
MID 或 CMF 文件。
计算机音频技术主要包括声音的采
集、数字化、压缩 /解压缩以及声音的
播放。
数字化 主要包括 采样 和 量化 这两个
方面。
采样频率 ( sampling rate)是将模拟
声音波形转换为数字时,每秒钟所抽取
声波幅度样本的次数,单位是
Hz(赫兹)。
量化数据位数 (也称量化级)是每
个采样点能够表示的数据范围,经常采
用的有 8 位,12 位和 16 位。
例如, 8 位量化级表示每个采样点
可以表示 256 个不同量化值,而 16 位量
化级则可以表示 65536 个不同的量化值
记录声音时,如果每次生成一个声
道数据,称为 单声道 ;每次生成两个声
波数据,称为 立体声 (双声道)。
数字音频的存储量,
可用以下公式估算声音数字化后每
秒所需的存储量(未经压缩的)
存储量 = 采样频率 × 量化位数 ÷ 8
例如,数字激光唱盘( CD-DA)的标
准采样频率为 44.1 kHz,量化位数为 16
位,立体声。一分钟 CD-DA 音乐所需的
存储量为
44.1 K× 16× 2× 60÷ 8 = 10584 KB
若使用双声道,存储量再增加一倍
Sampling
Resolution
8 bit
Sampling
Frequency
11 KHz
+127

+64
+32
0
-32
-64

-128
01001010
Comparison:
Sampling
Resolution
16 bit
Sampling
Frequency
22 KHz
+32767

+512
+128
0
-128
-512

-32768
0010101100011000
Comparison:
动画是活动的画面,实质是一幅幅
静态图像的连续播放。动画的连续播放
既指时间上的连续,也指图像内容上的
连续。
计算机设计动画有两种:一种是 帧
动画,一种是 造型动画 。
动画
帧动画 是由一幅幅位图组成的连续
的画面,就如电影胶片或视频画面一样
要分别设计每屏幕显示的画面。
造型动画 是对每一个运动的物体分
别进行设计,赋予每个动元一些特征,
然后用这些动元构成完整的帧画面。动
元的表演和行为是由制作表组成的脚本
来控制。
存储动画的文件格式有 FLC,MMM等
视频
视频是由一幅幅单独的画面序列
(帧 frame)组成,这些画面以一定
的速率( fps)连续地投射在屏幕上,
使观察者具有图像连续运动的感觉。
视频文件的存储格式有 AVI,MPG
MOV等。
视频标准主要有 NTSC制和 PAL制
两种。
NTSC 标准为 30fps,每帧 525行。
PAL 标准为 25fps,每帧 625行。
视频的技术参数有:
帧速
数据量
图像质量
1.2 多媒体技术的应用与发展
1.2.1 多媒体技术的应用
1.2.2 多媒体技术的发展方向
1.2.1 多媒体技术的应用
就目前而言,多媒体技术已在商业
教育培训、电视会议、声像演示等方面
得到了充分应用。
在教育与培训方面的应用
在通信方面的应用
在其他方面的应用
在教育与培训方面的应用
多媒体技术使教材不仅有文字、静
态图像,还具有动态图像和语音等。使教
育的表现形式多样化,可以进行交互式
远程教学。
利用多媒体计算机的文本、图形、
视频、音频和其交互式的特点,可以编制
出计算机辅助教学 CAI( Computer
Assisted Instruction )软件,即课件。
在通信方面的应用
多媒体技术在通信方面的应用主要有:
可视电话
视频会议
信息点播( Information Demand)
计算机协同工作 CSCW
( Computer Supported
Cooperative Work)
信息点播 有桌上多媒体通信系统和
交互电视 ITV。
计算机协同工作 CSCW是指在计算机
支持的环境中,一个群体协同工作以完
成一项共同的任务。
计算机的交互性,通信的分布性和
多媒体的现实性相结合,将构成继电报
电话、传真之后的 第四代通信手段 。
在其他方面的应用
多媒体技术给 出版业 带来了巨大的
影响,其中近年来出现的电子图书和电
子报刊就是应用多媒体技术的产物。
利用多媒体技术可为 各类咨询 提供
服务,如旅游、邮电、交通、商业、金
融、宾馆等。
多媒体技术还将改变未来的 家庭生
活,多媒体技术在家庭中的应用将使人
们在家中上班成为现实。
1.2.2 多媒体技术的发展方向
目前,多媒体主要从以下几个方向发展:
多媒体通信网络环境 的研究和建立
将使多媒体从单机单点向分布、协同多
媒体环境发展,在世界范围内建立一个
可全球自由交互的通信网。
对该网络及其设备的研究和网上分
布应用与信息服务研究将是热点。
1
利用图像理解、语音识别、全文检
索等技术,研究多媒体 基于内容的处理,
开发能进行基于内容的处理系统是多媒
体信息管理的重要方向。
多媒体标准 仍是研究的重点:各类
标准的研究将有利于产品规范化,应用
更方便。它是实现多媒体信息交换和大
规模产业化的关键所在。
2
3
多媒体技术 与相邻技术相结合,提
供了完善的人机交互环境。多媒体仿真
智能多媒体等新技术层出不穷,扩大了
原有技术领域的内涵,并创造新的概念。
多媒体技术与外围技术构造的虚拟
现实研究仍在继续进展。多媒体虚拟现
实与可视化技术需要相互补充,并与语
音、图像识别、智能接口等技术相结合,
建立高层次 虚拟现实系统 。
4
5
将来 多媒体技术将向着以下六个方向
发展;
1).高分辨化,提高显示质量;
2).高速度化,缩短处理时间;
3).简单化,便于操作;
4).高维化,三维、四维或更高维;
5).智能化,提高信息识别能力;
6).标准化,便于信息交换和资源共享。
1,3 多媒体的关键技术
1.3.1 视频音频数据压缩 /解压缩技术
1.3.2 多媒体专用芯片技术
1.3.3 大容量信息存储技术
1.3.4 多媒体输入与输出技术
1.3.5 多媒体软件技术
1.3.6 多媒体通信技术
1.3.7 虚拟现实技术
1.3.1 视频音频数据压缩 /解压缩技术
研制 MPC需要解决的关键问题之一
是要使计算机能适时地综合处理声、文
图信息。
选用合适的数据压缩技术,有可能
将字符数据量压缩到原来的 1/2左右,语
音数据量压缩到原来的 1/2-1/10,图像
数据量压缩到原来的 1/2-1/60。
如今已有压缩编码 /解压缩编码的
国际标准 JPEG 和 MPEG 。
1.3.2 多媒体专用芯片技术
专用芯片是多媒体计算机硬件体系
结构的关键。为了实现音频、视频信号
的快速压缩、解压缩和播放处理,需要
大量的快速计算,只有采用专用芯片,
才能取得满意的效果。
多媒体计算机专用芯片可归纳为两
种类型:一种是 固定功能的芯片 ;另一
种是 可编程的数字信号处理器( DSP)
芯片。
1.3.3 大容量信息存储技术
利用数据压缩技术,在一张 CD-ROM
光盘上能够存取 70多分钟全运动的视频
图像或者十几个小时的语言信息或数千
幅静止图像。
在 CD-ROM 基础上,还开发了 CD-I
和 CD-V、可录式光盘 CD-R、高画质、高
音质的光盘 DVD以及 PHOTO CD 等。
1.3.4 多媒体输入与输出技术
多媒体输入 /输出技术包括 媒体变换
技术, 媒体识别技术, 媒体理解技术 和
综合技术 。
媒体变换技术 是指改变媒体的表现
形式。如当前广泛使用的视频卡、音频
卡(声卡)都属媒体变换设备。
媒体识别技术 是对信息进行一对一
的映像过程。例如,语音识别技术和触
摸屏技术等。
媒体理解技术 是对信息进行更进
一步的分析处理和理解信息内容。如
自然语言理解、图像理解、模式识别
等技术。
媒体综合技术 是把低维信息表示
映像成高维的模式空间的过程。例如
语音合成器就可以把语音的内部表示
综合为声音输出。
1.3.5 多媒体软件技术
多媒体软件技术主要包括以下六个
方面的内容:
多媒体操作系统
多媒体素材采集与制作技术
多媒体编辑与创作工具
多媒体数据库技术
超文本 /超媒体技术
多媒体应用开发技术
多媒体操作系统
多媒体操作系统是多媒体软件的
核心。它负责多媒体环境下多任务的
调度、保证音频、视频同步控制以及
信息处理的实时性,提供多媒体信息
的各种基本操作和管理;具有对设备
的相对独立性与可扩展性。
Windows,OS/2 和 Macintosh 操
作系统都提供了对多媒体的支持。
多媒体素材采集与制作技术
素材的采集与制作主要包括采集并
编辑多种媒体数据。如声音信号的录制
编辑和播放;图像扫描及预处理;全动
态视频采集及编辑;动画生成编辑;音
/视频信号的混合和同步等。
多媒体编辑与创作工具
多媒体编辑创作软件又称多媒体创
作工具,是多媒体专业人员在多媒体操
作系统之上开发的,供特定应用领域的
专业人员组织编排多媒体数据,并把它
们连接成完整的多媒体应用系统的工具。
高档的创作工具用于影视系统的动
画制作及特技效果,中档的用于培训、
教育和娱乐节目制作,低档的用于商业
简介、家庭学习材料的编辑。
多媒体数据库技术
多媒体信息是结构型的,致使传统
的关系数据库已不适用于多媒体的信息
管理,需要从下面四个方面研究数据库
1).多媒体数据模型
2).媒体数据压缩和解压缩的模式
3).多媒体数据管理及存取方法
4).用户界面
超文本 /超媒体技术
超文本 是一种新颖的文本信息管理
技术,它提供的方法是建立各种媒体信
息之间的网状链接结构,这种结构由 节
点 组成。
对超文本进行管理使用的系统称为
超文本系统。也即浏览器,或称为导航
图。
若超文本中的节点的数据不仅可以
是文本,还可以是图像、动画、音频、
视频,则称为 超媒体 。
多媒体应用开发技术
多媒体应用的开发会使一些采用不
同问题解决方法的人集中到一起,包括
计算机开发人员、音乐创作人员,图像
艺术家等,他们的工作方法以及思考问
题的方法都将是完全不同的。
对于项目管理者来说,研究和推出
一个多媒体应用开发方法学将是极为重
要的。
1.3.6 多媒体通信技术
多媒体通信技术包含语音压缩、图
像压缩及多媒体的混合传输技术。
宽带综合业务数字网( B-ISDN) 是
解决多媒体数据的传输问题的一个比较
完整的方法,其中 ATM(异步传送模式)
是近年来在研究和开发上的一个重要成
果。
1.3.7 虚拟现实技术
虚拟现实 的定义可归纳为:利用计
算机技术生成的一个逼真的视觉、听觉
触觉及嗅觉等的感觉世界,用户可以用
人的自然技能对这个生成的虚拟实体进
行交互考察。
虚拟现实技术是在众多相关技术上
发展起来的一个高度集成的技术,是计
算机软硬件技术、传感技术、机器人技
术、人工智能及心理学等飞速发展的结
晶。
1.4 多媒体信息的计算机表示
1.4.1 声音文件的基本格式
1.4.2 图像及图像文件格式
1.4.3 视频和动画的文件格式
1.4.1 声音文件的基本格式
1,WAV 文件
3,VOC 文件
2,MIDI
4,MOD 文件
WAV 文件
Windows 所用的标准数字 音频 称为
波形文件,文件的扩展名是,,WAV”,它
记录了对实际声音进行采样的数据。它
可以重现各种声音,但产生的文件很大。
采用的软件压缩方法主要有 ACM
和 PCM 等。人的讲话声使用 8位量化级
11.025 KHz采样率就能较好的还原。 CD
音质需要 16位量化级,44.1 KHz的采样
率。
MIDI
MIDI文件的扩展名为,,MID”,它与
波形文件不同,记录的不是声音本身,
而是将每个音符记录为一个数字,因此
比较节省空间,可以满足长时间音乐的
需要。
MIDI 的主要限制是缺乏重现真实
自然的能力。采用 波表法 进行音乐合成
的声音卡可以使 MIDI 音乐的质量大大
提高。
VOC 文件,VOC 文件也是一种数字
声音文件,主要用于 DOS 程序。与波形
文件相似,可以方便地互相转换。
MOD 文件,MOD 文件是移植过来的
MODULE 音乐。它主要由一些业余音乐
爱好者通过网络和 BBS 支持。
1.4.2 图像及图像文件格式
图像 是由一些排成行和列的点组成
的,通常称为位图或点阵图。
图像文件在计算机中的存储格式有
多种,如,,BMP”,”,PCX”,”,TIF”,”,TGA”
“.GIF”,”,JPG” 等。
1,BMP格式
BMP 是标准的 WINDOWS 和 OS/2 的
图形和图像的基本位图格式,有压缩
( RLE)和非压缩之分。 BMP 支持黑白
图像,16色和 256色的伪彩色图像以及
RGB 真彩色图像。
2,PCX格式
是使用游程长编码( RLE)方法进
行压缩的图像文件格式文件。支持黑白
图像,16色和 256色的伪彩色图像、灰
度图像以及 RGB 真彩色图像,
3,GIF格式
GIF 是压缩图像存储格式,它使用
LZW 压缩方法,压缩比较高,文件长度
较小。支持黑白图像,16色和 256色的
彩色图像。
4,TIF格式
TIF 格式是工业标准格式,支持所
有图像类型。文件分成压缩和非压缩两
大类。
5,JPG和 PIC格式
JPG 和 PIC 都使用 JPEG 方法进行
图像数据压缩。这两种格式的最大特点
是文件非常小。它是一种有损压缩的静
态图像文件存储格式。支持灰度图像、
RGB 真彩色图像和 CMYK 真彩色图像。
6,PCD格式
PCD格式是 Photo-CD 的专用存储格
式,文件中含有从专业摄影照片到普通
显示用的多种分辨率的图像,所以数据
量都非常大。
Comparison:
Einstein.bmp
颜色:真彩色
大小,239.1 KB
压缩比,1.0
Einstein.gif
颜色,256
大小,61.4 KB
压缩比,1.3
Comparison:
Einstein.jpg
颜色:真彩色
大小,11.1 KB
压缩比,21.4
Einstein.tif
颜色:真彩色
大小,238.4 KB
压缩比,1.0
1.4.3 视频和动画的文件格式
动画 文件的格式主要有两种:
FLIC 格式和 MMM 格式。
视频 文件的使用一般与标准
有关,主要有 AVI,MOV,MPG、
DAT,DIR 等。
1,FLIC动画
早期版本的 FLIC文件只支持
320× 200× 256 色模式,文件的扩展名
为,,FIY”。较新版本支持的分辨率和颜
色数都有所提高,文件的扩展名也改为
,.FLC”。它使用了无损压缩方法,画面
效果十分清晰,但本身不能存储同步声
音。
2,MMM动画
MMM格式是微软多媒体动画的文件
格式。
3,AVI文件
AVI文件将视频和音频信号混合交错
地存储在一起。其文件扩展名为,,AVI”,
采用了 Intel公司的 Indeo视频有损压缩
技术,较好地解决了音频信息与视频信息
同步的问题。
4,MOV文件
MOV 是 Macintosh 计算机用的影视
文件格式。也采用了 Intel公司的 Indeo
视频有损压缩技术,以及视频与音频信息
混排技术。
5,MPG文件
是 PC机上全屏幕活动视频的标准文
件格式,它是使用 MPEG 方法进行压缩的
全运动视频图像。
6,DAT文件
DAT 是 Video CD 或 Karaoke CD数
据文件的扩展名,也是基于 MPEG 压缩
方法的一种文件格式。
7,DIR格式
DIR是 Marco Media公司使用的
Director 多媒体著作工具产生的电影
文件格式。
1.5 多媒体数据压缩技术
1.5.1 多媒体数据的冗余类型
1.5.2 数据压缩方法
1.5.3 视频编码的国际标准
1.5.1 多媒体数据的冗余类型
图像数据表示中存在着大量的冗
余,图像数据压缩技术就是利用图像
数据的冗余性来减少图像数据量的方
法。常见图像数据冗余类型如下:
1,空间冗余
2,时间冗余
3,视觉冗余
空间冗余
一幅图像表面上各采样点的颜色之
间往往存在着 空间连贯性,基于离散像
素采样来表示物体表面颜色的像素存储
方式可利用空间连贯性,达到减少数据
量的目的。
例如,在静态图像中有一块表面颜
色均匀的区域,在此区域中所有点的光
强和色彩以及饱和度都是相同的,因此
数据有很大的空间冗余。
时间冗余
运动图像一般为位于一时间轴区间
的一组连续画面,其中的相邻帧往往包
含相同的背景和移动物体,只不过移动
物体所在的空间位置略有不同,所以后
一帧的数据与前一帧的数据有许多共同
的地方,这种共同性是由于相邻帧记录
了相邻时刻的同一场景画面,所以称为
时间冗余 。
同理,语音数据中也存在着时间冗
余。
视觉冗余
人类的视觉系统对图像场的敏感度
是非均匀的。但是,在记录原始的图像
数据时,通常假定视觉系统近似线性的
和均匀的,对视觉敏感和不敏感的部分
同等对待,从而产生比理想编码(即把
视觉敏感和不敏感的部分区分开来的编
码)更多的数据,这就是 视觉冗余 。
1.5.2 数据压缩方法
压缩处理一般是由两个过程组成:
一是 编码 过程,即将原始数据经过编码
进行压缩,以便存储与传输;二是 解码
过程,此过程对编码数据进行解码,还
原为可以使用的数据。
数据压缩可分为两种类型:一种叫
做 无损压缩,另一种叫做 有损压缩 。
无损压缩
混合压缩
有损压缩
无损压缩
无损压缩常用在原始数据的存档,
如文本数据、程序以及珍贵的图片和图
像等。
其原理是统计压缩数据中的冗余
(重复的数据 )部分。常用的有:
RLE (run length encoding)行程编码
Huffman 编码
算术编码
LZW (lempel-ziv-welch)编码
(1)、行程编码( RLE)
RLE 编码是将数据流中连续出现的
字符用单一记号表示。
例如,字符串 AAABCDDDDDDDDBBBBB
可以压缩为 3ABC8D5B 。
RLE编码简单直观,编码 /解码速度
快,因此许多图形和视频文件,如,BMP
.TIFF及 AVI等格式文件的压缩均采用此
方法,
(2),Huffman编码
它是一种对统计独立信源能达到最
小平均码长的编码方法。
其原理是,先统计数据中各字符出
现的概率后,再按字符出现频率高低的
顺序分别赋以由短到长的代码,从而保
证了文件的整体的大部分字符是由较短
的编码构成的。
(3)、算术编码
其方法是将被编码的信源消息表示
成实数轴 0-1之间的一个间隔,消息越
长,编码表示它的间隔就越小,表示这
一间隔所需的二进制位数就越多。
该方法实现较为复杂,常与其它有
损压缩结合使用,并在图像数据压缩标
准 (如 JPEG)中扮演重要角色。
(4),LZW编码
LZW(Lempel-Ziv-Welch)压缩使用
字典库查找方案。它读入待压缩的数据
并与一个字典库 (库开始是空的 )中的字
符串对比,如有匹配的字符串,则输出
该字符串数据在字典库中的位置索引,
否则将该字符串插入字典中。
许多商品压缩软件如 ARJ,PKZIR、
ZOO,LHA等都采用了设方法。
另外,.GIF 和,TIF 格式的图形
文件也是按这一文件存储的。
有损压缩
图像或声音的频带宽、信息丰富,
人类视觉和听觉器官对频带中某些频率
成分不大敏感,有损压缩以牺牲这部分
信息为代价,换取了较高的压缩比。
常用的有损压缩方法有,PCM(脉冲
编码调制 )、预测编码、变换编码、插值
与外推等。
新一代的数据压缩方法有:矢量量
化和子带编码、基于模型的压缩、分形
压缩及小波变换等。
混合压缩
混合压缩是利用了各种单一压缩的
长处,以求在压缩比、压缩效率及保真
度之间取得最佳折衷。
该方法在许多情况下被应用,如
JPEG 和 MPEG 标准就采用了混合编码的
压缩方法。
1.5.3 视频编码的国际标准
1、静止图像压缩标准
2、运动图像压缩标准
3.视频通信编码标准
静止图像压缩标准
国际标准化组织 (ISO)和国际电报
电话咨询委员会 (CCITT)联合成立的
,联合照片专家组, JPEG
(joint photographic experts group)
于 1991年提出的
,多灰度静止图像的数字压缩编码,
(简称 JPEG标准 )。
这是一个适应于彩色和单色多灰度
或连续色调静止数字图像的压缩标准。
JPEG标准 支持很高的图像分辨率
和量化精度。它包含两部分:
第一部分是 无损压缩,基于差分
脉冲编码调制 (DPCM)的预测编码。
第二部分是 有损压缩,基于离散
余弦变换 (DCT)和 Huffman编码,通常
压缩 20-40倍。
运动图像压缩标准
视频图像压缩的一个重要标准是
MPEG (Moving Picture Experts Group)
于 1990年形成的一个标准草案
(简称 MPEG标准 )。
它兼顾了 JPEG标准和 CCITT专家组
的 H.261标准。
MPEG标准 分成 MPEG视频,MPEG音频
和 MPEG系统三大部分。
MPEG算法除了对单幅图像进行编码
外 (帧内编码 ),还利用图像序列的相关
特性去除帧间图像冗余,大大提高了视
频图像的压缩比。
压缩比可达到 60-100倍。
视频通信编码标准
多媒体通信中的电视图像编码标准
都采用 H.261和 H.263。 H.261主要用来
支持电视会议和可视电话。
电视图像数据压缩后的数据速率为
P× 64kb/s,其中 P是一个可变参数,取
值范围是 1-30。
H.263是在 H.261的基础上开发的电
视图像编码标准,用于低位速率通信的
电视图像编码。
1.6 多媒体与因特网
因特网 (Internet)是一个通过网络
设备把世界各国的计算机相互连接在一
起的计算机网络。在这个网络上,使用
普通的语言就可以进行相互通信、协作
研究、从事商业活动,共享信息资源。
因特网是二十世纪全球发展最迅速
影响最深远和冲击最大的信息存取和处
理工具。
万维网 WWW (Word Wide Web)是一个
在因特网上运行的全球性分布式信息系
统。由于它支持文本、图像、声音、影视
等数据类型,而且使用超文本、超链接技
术把全球范围里的信息链接在一起,所以
也称为超媒体环球信息系统。
万维网技术是因特网上环球信息系统
设计技术上的一个重大突破,是目前最热
门的多媒体技术。
本章小结
本章对多媒体和多媒体技术的定义
及特点、多媒体计算机要解决的关键技
术以及多媒体技术的应用和发展、媒体
信息的计算机表示等问题作了较详细的
讨论。
多媒体计算机技术是综合处理声、
文、图、音频、视频等信息的技术,多
媒体计算机具有信息载体的多样性、集
成性和交互性的特点。
多媒体的关键技术包括多媒体计算
机系统要解决的关键技术(如媒体数据
的压缩编码和解码技术、专用芯片技术、
多媒体数据的输入 /输出技术)和多媒体
应用设计中的关键技术两个方面。
多媒体的应用丰富多彩,不仅涉及
到计算机的各应用领域,也涉及到教育
培训、电子出版、通信、文化娱乐等领
域或行业。
多媒体计算机技术将朝着高分辨率
化、高速度化、简单化、标准化和智能
化方向发展。