http://www.wenyuan.com.cn/webnew/
第 3章 多媒体数据的量化与压缩
(时间,2次课,4学时)
http://www.wenyuan.com.cn/webnew/
教学提示,本章主要介绍多媒体数据压缩的必要性,多媒体数据量化的概念;简介多媒体数据压缩技术,声音数据的压缩,静态图像的无损压缩和 JPEG标准,动态图像的压缩及 MPEG标准,并简要介绍了几种数据压缩编码方法 。
教学目标,读者在学习中应当理解上述基本概念,掌握思想方法,了解压缩技术在计算机多媒体技术中的作用 。
第 3章 多媒体数据的量化与压缩
http://www.wenyuan.com.cn/webnew/
第 3章 多媒体数据的量化与压缩
3.1 多媒体数据压缩的必要性
3.2 多媒体数据的量化
3.3 多媒体数据压缩技术
3.4 多媒体数据的压缩
3.5 习题
http://www.wenyuan.com.cn/webnew/
3.1 多媒体数据压缩的必要性多媒体数据压缩和编码技术是计算机多媒体的关键技术 。 计算机多媒体系统需要具有综合处理声,文,图数据的能力,能面向三维图形,立体声,真彩色高保真全屏幕运动画面,应当能实时处理大量数字化视频,音频信息 。 这些操作对计算机的处理,存储,传输能力都有较高的要求 。
http://www.wenyuan.com.cn/webnew/
3.1 多媒体数据压缩的必要性多媒体数据压缩的理论正在不断地发展和深化 。 对声音数据的压缩一般采用去掉重复代码和去掉声音数据中的无声信号序列两种方法 。
对静止图像信息,特别是视频图像信息数据的压缩是比较复杂 的,对静 止图像 压缩广 泛采用 JPEG(Joint
Photographic Expert Group)算法标准,由于计算机的中央处理器 CPU完成 JPEG算法花费的时间太长,所以都是用专门的 JPEG算法信号处理器来完成运算 。 对视频图像的压 缩 算 法 有 MPEG(MovingPictureExpertGroup) 和
DVI(Digital Video Interactive)算法 。 这些算法是由相应的算法信号处理器来完成 。
http://www.wenyuan.com.cn/webnew/
3.2 多媒体数据的量化声音是携带信息的重要媒体,是多媒体技术研究中的一个重要内容,声音的种类很多,如语音,乐器声,动物发出的声音以及自然界的雷声,风声,雨声等 。 这些声音有许多共同的特性,也有它们各自的特性 。 在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们各自的特性 。
http://www.wenyuan.com.cn/webnew/
3.2 多媒体数据的量化用数字量而不用模拟量做信号处理的主要优点是:
数字信号计算是一种精确的运算方法,它不受时间和环境变化的影响 。
表示部件功能的数学运算不是物理的功能部件,而是使用数学运算模拟,其中的数学运算也相对容易实现 。
可以对数字运算数据进行程序控制,如可以改变算法或改变某些功能,还可以对数字部分进行再编程 。
http://www.wenyuan.com.cn/webnew/
3.2 多媒体数据的量化对声音进行数字化需要解决两个问题:
每秒钟需要采集多少个声音样本,也就是采样频率取多大 。
声音样本分为多少种情况,用多少个二进制位来存储表示每种情况的数据,称为量化精度 。
http://www.wenyuan.com.cn/webnew/
3.2 多媒体数据的量化
提示,采样频率的高低是根据奈奎斯特理论和声音信号本身的最高频率决定的 。 奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍 。 满足奈奎斯特理论的数字表达的声音可以还原成原来的声音,这叫做无损数字化 。
http://www.wenyuan.com.cn/webnew/
3.3 多媒体数据压缩技术
3.3.1 数据压缩
3.3.2 数据压缩过程
3.3.3 数据压缩的主要指标
http://www.wenyuan.com.cn/webnew/
3.3.1 数据压缩
数据压缩是一种数据处理的方法,它的作用是将一个文件的数据容量减小,而又基本保持原来文件的内容
数据压缩的目的就是减少信息存储的空间,缩短信息传输的时间 。 当需要使用这些信息时,需要通过压缩的反过程 —— 解压缩将信息还原 。
http://www.wenyuan.com.cn/webnew/
3.3.1 数据压缩提示,
多媒体数据的量化,压缩和解压缩的过程为:
多媒体 → 采样 → 量化 → 经过压缩 → 存储 → 传输 →
解压缩 → 还原
http://www.wenyuan.com.cn/webnew/
3.3.2 数据压缩过程研究表明,一个文件所包含的数据量并不等于它所包含的信息量 。 例如,一页纸上,有许多空白的地方,其信息量就小 。 对信息而言,这些与信息无关的数据是多余的,这些多余的信息,在技术上称为信息,冗余,。
http://www.wenyuan.com.cn/webnew/
3.3.2 数据压缩过程
1,信息存在,冗余,的两个例子
(1) 在一篇文章中,若多次出现,多媒体实用技术,这个词
,而这个词按照计算机的汉字编码,需要 14个字节 。 如果定义一个符号来表示它,可以达到减少信息量的目的 。
(2) 一幅图画,大部分区域是蓝色的背景 。 当连续出现 3000
个蓝色像素时,原始信息要连续记录 3000个,蓝色像素,;如果改用一个简单的词组 ——“3000个蓝色像素,来描述这 3000个,蓝色像素,,信息量也会大大减少 。
http://www.wenyuan.com.cn/webnew/
3.3.2 数据压缩过程
2,信息,冗余,的种类
空间冗余 图像中相邻的像素具有相同的属性,属于,空间冗余,。
时间冗余 视频序列中相邻的帧具有相同的画面,属于,
时间冗余,。
http://www.wenyuan.com.cn/webnew/
3.3.2 数据压缩过程
3,压缩的种类
无损压缩 由相关性进行数据压缩并不一定损失原信息的内容,因此可实现,无损压缩,。
有损压缩 经过压缩后不能将原来的文件信息完全保留的压缩,称为,有损压缩,,是不可逆压缩方式 。
http://www.wenyuan.com.cn/webnew/
3.3.3 数据压缩的主要指标有较高的压缩比,压缩和解压缩时间短,解压缩后信息恢复质量高和通用性强是评价压缩好坏的主要方面 。
1,有较高的压缩比即压缩前后的数据量之比,如果文件的大小为 1MB,经过压缩处理后变成 0.5MB,那么压缩比为 2:1。 高的压缩比是数据压缩的根本目的,无论从哪个角度看,在同样压缩效果的前提下,数据压缩得越小越好 。 当然还要考虑多媒体数据压缩后的输入和输出表示方式 。
http://www.wenyuan.com.cn/webnew/
3.3.3 数据压缩的主要指标
2,压缩和解压缩时间短数据的压缩和解压缩是在一定数学模型的基础上,通过一系列数学运算实现的 。 计算方法的好坏直接关系到压缩和解压缩过程所需要的时间 。
http://www.wenyuan.com.cn/webnew/
3.3.3 数据压缩的主要指标
3,解压缩后信息恢复质量高对于文本等文件,特别是是程序文件,是不允许在压缩和解压缩过程中丢失信息的 。 因此需要采用无损压缩,不存在压缩后恢复质量的问题 。 对于图像,声音和视频影像,
数据经过压缩后允许信息的部分丢失 。 在这种情况下,信息经解压缩后不可能完全恢复,压缩和解压缩质量就不能不考虑 。 因此,是否具有好的恢复质量是数据压缩的另一个重要指标 。
http://www.wenyuan.com.cn/webnew/
3.3.3 数据压缩的主要指标
4,通用性强数据压缩的通用性有两层含义:
所有同类型的文件应当采用一个通用的压缩方法,否则用 A方法压缩的文件,用 B方法解压缩就解不出来 。 因此,
压缩方法的标准化十分重要 。
同一个压缩软件应当能提供多种压缩比和压缩质量的选择,以适应不同场合的需要 。
http://www.wenyuan.com.cn/webnew/
3.4 多媒体数据的压缩
3.4.1 声音数据的压缩
3.4.2 静态图像的无损压缩和 JPEG标准
3.4.3 动态图像的压缩及 MPEG标准
3.4.4 数据压缩编码
http://www.wenyuan.com.cn/webnew/
3.4.1 声音数据的压缩声音是由不同频率的声波组合而成的 。 组合的波形需要进行模 ——数转换,用采样频率和样本量化值加以描述,这通常需要很大的数据量,而且数据量的大小与声音所包含的频率大小关系不大 。
语音的压缩技术通常采用波形编码技术,或是基于语音生成模型的压缩技术 。
音乐信号的压缩也可以用语音的压缩技术来实现,但是,音乐信号虽然可以用语音压缩技术来实现,但当压缩比较高时,重构音乐信号的质量通常不能令人满意 。
http://www.wenyuan.com.cn/webnew/
3.4.2 静态图像的无损压缩和 JPEG标准
1.图像压缩的概念图像数据的相关性首先表现在相邻平面区域的像素点有相近的亮度和颜色值 。 例如,人脸和人的衣服总是表现为比较相近的色调,正是这些相关性使图像的压缩有了可能 。
2.静态图像的 JPEG国际标准按照压缩技术原理,应用背景,功能以及用户的要求不同,图像数据压缩的方法大致可以分为可逆编码和不可逆编码 。 可逆编码一般是基于信息熵原理的 。
提示,JPEG就是一个图像压缩的国际通用标准 。 这个标准是由
JPEG(Joint Photographic Experts Group,联合图像图形专家组 )
于在 1991年 3月制定出来的,提出了全称为,多灰度静止图像数字压缩编码,的标准 。 该标准包括无损压缩标准和有损压缩标准两部分 。
http://www.wenyuan.com.cn/webnew/
3.4.3 动态图像的压缩及 MPEG标准
1,动态图像的概念动态图像是由一序列静态图像构成的,所以对静态图像的压缩同样适用于对动态图像的压缩 。 静态图像的压缩方法只考虑二维空间信息的相关性,没有考虑动态图像存在的帧与帧之间的时间相关性 。
相邻帧之间的相关性表现在以下几个方面:
动态图像以每秒 24帧或 25帧播放,在如此短的时间内,
画面通常不会有大的变化 。
在画面中变化的只是运动的部分,静止的部分往往占有较大的面积
即使是运动的部分,也多为简单的平移 。
http://www.wenyuan.com.cn/webnew/
3.4.3 动态图像的压缩及 MPEG标准
2,动态图像压缩的基本思路考虑到帧与帧之间存在相关性,一个很自然的想法是,将相邻的画面相减 。 例如将第 1帧记作 A,第 2帧记作 B,定义 B'=B-A。 这里两帧相减是将后一帧画面 B中的每一个点的像素值减去前一帧画面 A中相应点的像素值,称为差异帧 。 同样可将第三帧记作 C,C'= C-B。 依此类推,B'和 C'
可看作是一帧帧图像,压缩后的动态图像文件用 A',B',
C'等来描述 。
http://www.wenyuan.com.cn/webnew/
3.4.3 动态图像的压缩及 MPEG标准用差异帧代替原来的帧,以揭示帧间的相关性,这是动态图像压缩的基本出发点 。 但这样做也会带来新问题:
(1) 如果只保留第 1帧,其他帧采用差异帧 。 那么后面的每一帧都需要从前一帧计算出来,恢复时也必须按一帧帧的顺序进行 。 这样就无法从想跳到的某一点进行播放,很不方便 。 一旦某一帧数据出了问题,后面的帧更无法恢复 。
(2) 由于差异帧的压缩是有损的 。 上述方式在压缩和解压缩时将发生误差的积累,积累到一定程度,会造成很大程度的失真 。
http://www.wenyuan.com.cn/webnew/
3.4.3 动态图像的压缩及 MPEG标准
(3) 图像整体运动也是动态图像经常采用的表现手法,若干次简单地相减,差异帧就不能很好地揭示相邻帧之间的相关性,也不可能得到高的压缩比 。 差异帧只能揭示活动图像中静止部分的相关性 。 对差异帧比对原来的帧更难压缩 。
http://www.wenyuan.com.cn/webnew/
3.4.3 动态图像的压缩及 MPEG标准
3,动态图像的 MPEG标准
MPEG标准包括 MPEG-I标准和 MPEG-II标准:
(1) MPEG-I的数据传输速率为 1 Mb/s~1.5 Mb/s。 实现普通电视质量 (VHS,320 × 240)的全动态图像和 CD质量立体声伴音的压缩 。
(2) MPEG-II数据传输速率为 10Mb/s,实现对每秒 30帧的
720× 572分辨率的视频信号进行压缩或更高清晰度的视频影像标准 。
http://www.wenyuan.com.cn/webnew/
3.4.3 动态图像的压缩及 MPEG标准
提示,国际标准化组织 ISO建立了专门制定动态图像编码压缩标准的国际组织 (MPEG,Moving Picture Expert
Group),美国的 AT& T,IBM和日本的 SONY,NEC、
JVC等公司都是该组织的成员,经过两年的工作,比较了
14个不同的方案,兼顾了 JPEG静态图像压缩标准和
CCITT专家组的 H.261标准,于 1990年 9月通过了 MPEG-I
标准,1993年 11月通过了 MPEG-II标准 。
http://www.wenyuan.com.cn/webnew/
3.4.4 数据压缩编码数据压缩编码包括游程编码,四叉树编码,哈夫曼编码,算术编码和其他一些编码 。
1,游程编码游程编码用 RLE(RunLength Encoding)表示 。
用 RLE编码方法得到的代码中用一个数字表示行程的长度,后面的数字代表像素的颜色值 。
RLE是一种相当直观的压缩编码技术,而且非常经济 。 RLE所能获得的压缩比大小,主要取决于图像本身的特点 。
RLE是一种直观通用的位映射图像的压缩技术 。 它的基本思想是:
把表征图像每个像素的数据 (亮度及颜色值 )按照图像的像素位置,从左到右,由上至下地排列成一个一维的数据系列,然后按这一序列顺序编码 。
http://www.wenyuan.com.cn/webnew/
3.4.4 数据压缩编码
连续像素的个数称为 游程 。
游程编码 有 定长 和 变长 两种,定长游程编码的游程用固定位数的二进制表示,如果相同颜色的像素个数超过这个位数,则进行下一轮游程编码 。
变长游程编码 的游程用不同位数的二进制表示编码,但需要增加标志位说明二进制的位数 。 这种方法能有效地压缩图像中连续的相同颜色造成的相关性,适用于压缩颜色数目较少,色块较大的图像 。
http://www.wenyuan.com.cn/webnew/
3.4.4 数据压缩编码
2,四叉树编码四叉树编码也是属于位映射图像的压缩技术,如果图像中包括大块的亮度及颜色值相同的区域,可采用这种方法 。
它的基本思想是:先将整个图像划分为 4个象限,对于象限中像素数值 (亮度和颜色值 )不相同的象限,再进一步细分区域,直到每一个区域像素的数值都一样为止,这样将产生一个树状结构,树的每一个端点标出相应区域的像素数值 。
http://www.wenyuan.com.cn/webnew/
3.4.4 数据压缩编码
3,哈夫曼编码哈夫曼编码是一种典型的统计编码方法 。 在数据中总是存在每种非均匀的数值分布,某些数值出现的频率比其他数值高 。 根据数据中各个符号出现的概率,对出现频率高的符号赋予较短的代码,出现频率低的符号赋予较长的代码
,这样就会减少总的代码量,而且不减少信息总的含量,
属于无损压缩 。
http://www.wenyuan.com.cn/webnew/
3.4.4 数据压缩编码
4,算术编码算术编码是无损编码 。 算术编码在图像数据压缩标准中是很重要的 。 在算术编码中,信源用 0至 1之间的实数进行编码 。 算术编码用符号的概率和它的编码间隔两个基本的参数描述 。
5,其他编码除了前面介绍的编码方法外,还有香农 ——范诺编码,词典编码等其他编码 。 在此不做详细介绍 。
http://www.wenyuan.com.cn/webnew/
3.5 习题一,选择题
1,选用合适的数据压缩技术,有可能将原始文字量数据压缩
__________左右 。
A.1/2 B.1/10 C.1/50 D.1/100
2,选用合适的数据压缩技术,有可能将语音数据量压缩到原来的
__________左右 。
A.1/2~1/10 B.1/20~1/30 C.1/30~1/40 D,1/40~1/50
3,选用合适的数据压缩技术,有可能将图像数据量压缩到原来的
__________左右 。
A.1/2~1/60 B,1/20~1/100 C.1/30~1/120 D.1/40~1/90
http://www.wenyuan.com.cn/webnew/
3.5 习题一,填空题
1.多余的信息,在编码技术上称为信息,__________”。
2.图像中相邻的像素具有相同的属性,其属于,__________”。
3,视频序列中相邻的帧具有相同画面的属性,其属于,__________”

4.,无损压缩,是一种 __________压缩 。
5.一个状态越有序,熵值就越 __________。
6.物理学中有一个量度有序和无序的物理量,叫做,__________”。
http://www.wenyuan.com.cn/webnew/
3.5 习题三,判断改错题
1.缩速度和解压缩速度是衡量压缩系统性能的两个相关的指标 。 ( )
2.可逆编码一般是基于信息熵原理的 。 ( )
3,静态图像的压缩方法不仅考虑二维空间信息的相关性,还考虑到动态图像存在的帧与帧之间的相关性 。 ( )
四,简答题
1.简述用数字量而不在模拟量做信号处理的主要优点 。
2.进行数据压缩首先要解决的问题是什么?
http://www.wenyuan.com.cn/webnew/
3.5 习题五,综合题
1,叙述利用差异帧进行动态图像压缩的基本思路 。
2,叙述音频数字化处理的过程,说明影响数字音频质量和声音文件大小的主要因素 。
3,静态图像的压缩标准和动态图像的压缩国际标准是什么?
http://www.wenyuan.com.cn/webnew/
Q & A?
Thanks!