第三章多媒体数据压缩编码技术中国水利水电出版社多媒体技术与应用
3.1 多媒体数据压缩的重要性信息时代的重要特征是信息的数字化。早期的信息用模拟方式表示,模拟存在着明显的缺点:在信息的传输过程中会产生噪音和信号丢失;信息在复制过程中其噪音和误差会逐步积累;模拟信号不适合数字计算机加工处理。信号的数字化克服了上述缺点,但数字化后未经压缩的视频和音频等媒体信息的数据量是非常大的。
在多媒体系统中,如果不进行数字信息的压缩处理,计算机系统几乎无法对多媒体数据进行存取和传输 。 对多媒体数据进行压缩是非常必要的 。
3.1.1 多媒体数据压缩的必要性多媒体技术与应用
3.1.2 多媒体数据压缩的可行性可以根据不同的冗余设计相应的数据压缩技术 。
时间冗余
空间冗余空间冗余和时间冗余是将图像信号看作为随机信号时所反映出的统计特征,因此有时把这两种冗余称为统计冗余 。
结构冗余
知识冗余
视觉冗余
听觉冗余多媒体技术与应用
3.2 多媒体数据压缩方法数据压缩技术的性能指标有三个:
压缩比:
图象质量:
压缩和解压的速度:
图像和视频压缩方法哈夫曼编码行程编码算术编码
LZW编码
DCT编码小波变换子带编码无损压缩 有损压缩预测编码 变换编码 模型编码运动补偿混合编码分形编码
JPEG
MPEG
H.261
图 3-1图像和视频压缩方法多媒体技术与应用
3.2.1 有损压缩编码
预测编码预测编码方法是根据某一模型,利用以往的样本值进行预测。预测编码方法在图像数据和语音信号数据压缩中都得到广泛应用,它是针对数据的统计冗余进行压缩的一种方法。
变换编码变换编码也是一种对统计冗余进行压缩的方法 。 变换编码并不直接对信号进行压缩编码,而首先将信号映射到另一个域中,产生一组变换系数,然后对这些系数进行量化,编码,传输 。 一般在空间上具有强相关性的信号,反映在频域上则是能量被集中在某些特定的区域内,或是变换系数的分布具有规律性 。 利用这些规律,在不同的频率区域上分配不同的量化比特数,可以达到压缩数据的目的 。
多媒体技术与应用变换编码原理如图 3-3所示。
A’
发送端输入端
G
U
G’
A
变换 量化信道编码器逆变换 解码器
U’′
输出端图 3-3变换编码原理图多媒体技术与应用
3.2.2 无损压缩编码哈夫曼编码属于一种变字长码,把信息源事件按概率大小顺序排列,对出现概率大的信息源事件赋予短码字,而对于概率小的信息源事件赋予长码,只要码字长度按照信息出现的概率大小逆顺序排列,则平均码字长度一定小于其它任何事件顺序的排列方式。
实现哈夫曼编码的步骤是:
1,将信息源事件按概率递减顺序排列,如 P(1)> P(2)> … > P(Sm-1)> P(Sm)
2,把其中两个最小的概率 P(Sm-1),P(Sm)挑出来,且将事件,1”赋给其中最小的即
3,把两个最小概率相加作为新事件的概率,即求出,P(Si) =P(Sm-1) 十
P(Sm)。 P(Si)是对应于一个新的消息的概率。
4,将 P(Si)与上面未处理的( m- 2)个消息 P(Sm-2)的概率重新由大到小再排列,构成一个新的概率序列。
5,重复步骤 2),3),4),在每次合并信息源时,将被合并的信源分别赋
,0”和,1”直到所有 m个事件的概率均已全部合并处理为止。
6,寻找从每一个信息源事件到概率总和为 1处的路径,对每一信息源事件写出
,1”,,0”序列(从树根到信息源事件节点)作为码字。
多媒体技术与应用
3.3 多媒体数据压缩的国际标准
JPEG标准有两种基本的压缩算法,一种是基于离散余弦变换 DCT的有损压缩算法;另一种是基于空间预测的无损压缩算法。在压缩比为 25:1的有损压缩算法下,压缩还原后得到的图像与原始图像相比较几乎没有区别,因此基于离散余弦变换 DCT的有损压缩算法得到了广泛的应用。
3.3.1 JPEG标准多媒体技术与应用
DCT基解码器压缩图像数据 熵解码器 逆量化器 IDCT
重构图像数据熵编码表 量化表图 3-7DCT基解压缩步骤
DCT基编码器压缩图像数据FDCT 量化器 熵编码器源图像数据
8× 8图像块量化表 熵编码表图 3-5 DCT基压缩编码步骤多媒体技术与应用
3.3.2 MPEG标准
MPEG-1标准,称为多媒体运动图像和伴音的数据压缩编码标准 。
MPEG-2标准,称为,活动图像及有关声音信息的通用编码,标准 。
MPEG-4标准,是为解决多媒体计算机技术中对数据压缩编,解码技术及其遵循标准的高需求而推出的新的国际标准 。
MPEG-7标准,称作,多媒体内容描述接口,。 它为各种类型的多媒体信息规定一种标准化的描述 。
MPEG-21标准,正式名称为多媒体框架 。 试图用多媒体框架将各种服务综合在一起并进行标准化 。
多媒体技术与应用视频压缩和音频压缩标准视频压缩标准视频压缩算法用使用了帧间预测编码技术,运动补偿技术,空间压缩 ( 帧内压缩 ) 技术以及上一节介绍到的哈夫曼熵编码技术 。
帧间预测编码技术
I运动补偿技术
空间压缩 ( 帧内压缩 ) 技术音频压缩标准
MPEG-1音频编码是国际上制定的第一个高保真立体声音频编码标准
(ISO11172-3)。 通过对 14种音频编码方案的比较测试,最后选定了以
MUSICAM为基础的三层编码结构 。 根据不同的应用要求,使用不同的层来构成其音频编码器 。
多媒体技术与应用
MPEG音频压缩标准有以下特点:
1.音频信号采样率可以是 22KHz,44.1KHz或 48KHz。
2,压缩后的比特流可以按以下 3种模式之一支持单声道或双声道:
( 1) 提供给单音频通道的单声道模式 。
( 2) 提供给两个独立的单音频通道的双 — 单声道模式 。
( 3) 提供给立体声通道的立体声模式 。
3.提供 3个独立的压缩层次,(MP1,MP2,MP3)
4.编码后的比特流支持循环冗余校验 CRC。
5.还支持在比特流中携带附加信息 。