第 4章 信息的存储与压缩
信息技术的核心在于信息的处理与存储 。 多媒体信息包括文本,图形,图像,声音等,由于这些媒体的信息量相当大,数字化后要占用大量的存储空间,使得存储与处理都十分困难 。
尤其在图像信息的存储和压缩方面,
其重要性作用表现得尤为明显 。
本章小结
在信息技术的几个环节(获取、传输、存储、
显示、处理)中,信息存储是重要的环节之一。
为减少数字化信息在存储和传输时所占用的空间和时间,数据压缩技术就成为信息处理中的关键技术之一。信息存储涉及到材料科学、电子学、光电子学、光子学以及计算机科学等,
是一个综合性的技术。通过本章的学习,读者应了解磁存储技术与光存储技术的主要特点,
理解图像压缩的基本概念,以及预测编码、变换编码和统计编码的主要思想,并对 JPEG和
MPEG的图像压缩标准及实现方法有一定的了解。
4.1 信息存储技术的三次革命
历史学家通常把文字的出现当做文明史的开端。
文字记载是人在大脑之外寻找记忆载体的方式。
通过记载,人的思想和关于历史事件传说得到保存、复制和流传。人们由此而有了历史。文字的出现是人类历史上第一次划时代的信息载体革命,这场革命的实质就是实现了脑外信息贮存方式。随着印刷术的应运而生,它是人类历史上规模空前的信息复制革命,可以说是继文字出现之后的第二次信息载体革命。科学史家通常把电讯业的出现当做人类历史上第三次信息 (载体 )革命。不过今天也有人把这一佳冠授予计算机和互联网。
4.2 计算机存储系统
4.2.1 信息存储技术的金字塔结构计算机的存储设备从体系结构上看可分为内存储器和外存储器 。 内存储器直接与计算机的 CPU相连,处于金字塔的最上层 。
它的存取速度要求能与 CPU相匹配,通常由半导体存储器芯片组成,由于成本高,
容量通常不太大 。 再下一层是邻机存储器,
它由存取速度比硬盘更慢的光盘机,光盘库等设备组成 。 磁盘 ( 包括软盘和硬盘 )
与光盘均提供联机服务 。 最底层是脱机存储器 ( 或称离线存储器 ),由磁带机和磁带库组成 。
4.2 计算机存储系统
4.2.2 磁存储技术磁存储技术就是利用磁介质的这一特性来存储信息的 。 数据 ( 声像 ) 以电信号的形式通过录制磁头转换成磁信号储存在磁性介质上 。 重放时,只要通过磁头将磁性介质上的磁信号还原成电信号,就可以在计算机屏幕上显示出信息 。
软磁盘存储
硬盘
磁盘阵列
磁带存储
4.2 计算机存储系统
4.2.3 光存储技术光存储介质与磁存储介质之间的本质区别在于前者使用光技术,而后者使用磁技术 。 光存储技术通过光学的方法读出和写入数据,由于使用的光源基本上是激光 (也可以使用其他光源 ),所以又称为激光存储 。 光盘具有一切存储介质的优点,如大容量,耐用,易保存,标准化等 。 由于它非常适合于大量生产,
作为计算机软件,多媒体出版物,计算机游戏等发行量大的电子出版物是非常合适的 。
4.3 图像数据压缩与编码技术
4.3.1 熵与信息压缩从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,
去除确定的信息 (可推知的 ),也就是用一种更接近信息本质的描述来代替原有冗余的描述 。 所以,将香农的信息论观点运用到图像信息的压缩,所要解决的问题就是如何将图像信息压缩到最小,
但仍携有足够信息以保证能复制出与原图近似的图像 。
4.3 图像数据压缩与编码技术
4.3.2 图像数据压缩的可能性多媒体视频信号的冗余度存在于结构和统计两方面 。 在结构上的冗余度表现为很强的空间 ( 帧内 ),和时间
( 帧间 ) 相关性 。
空间冗余
时间冗余
视觉冗余
4.3 图像数据压缩与编码技术
4.3.3 压缩编码方法的分类与评价压缩编码的分类方法有许多种,如果从信息论的角度来认识可分为两大类:
4.3 图像数据压缩与编码技术无损压缩是指数据在压缩或解压缩过程中不会改变或损失原有的信息,解压缩产生的数据是对原始对象的完整复制,没有失真。无损压缩从数学上讲是一种可逆运算。
有损压缩算法靠丢掉大量冗余信息来降低数字图像所占的空间,回放时也不能完整地恢复原始图像,而将有选择地损失一些细节,损失多少信息由需要多高的压缩率决定。
4.3.4 数据压缩编码技术的发展
第一代编码技术 —— 经典编码方法
1959年,Shannon进一步确立了码率失真理论,以上工作奠定了信息编码的理论基础 。 主要编码方法有预测编码,变换编码和统计编码,也称为三大经典编码方法 。 经典编码技术又可以称为,第一代,
编码技术 。
,第二代,编码方法
,第二代,编码方法主要有:基于分形的编码,基于模型的编码,基于区域分割的编码和基于神经网络的编码等 。
4.3.5 图像压缩编码方法数据的压缩都可以看成是一种变换,解压缩 (恢复数据 )就是一种反变换,变换的实现方法即编码技术,每一种编码方法都是实现数据压缩的具体操作,对于不同的多媒体数据,可以有选择地采取某种编码方法 。
预测编码
变换编码
统计编码
混合编码
图像与视频压缩标准
4.4 静态图像压缩标准 —
— JPEG
JPEG(念作,jay-peg”)是,The
Joint Photographic Expert Group”的缩写,它是由国际电报咨询委员会 (CCITT)和国际标准化组织 (ISO)联合组成的专家组,
共同制定的静态数字图像压缩标准。 JPEG
的算法的基础是离散余弦变换 (DCT)和哈夫曼 (Huffman)变换,其压缩过程可分成 DCT
变换、量化和编码三个阶段。
4.4 静态图像压缩标准 —
— JPEG
4.4.1 离散余弦变换离散余弦变换 (Discrete cosine
Transform),简称 DCT。它是变换编码中的一个非常重要的成员。
DCT的优点很多,主要表现为:
1.已证明 DCT是许多图像的最佳变换 ;
2.DCT可以将N × N图像的空间域转换为频率域,
只需要少量的数据点表示图像;
4.4 静态图像压缩标准 —
— JPEG
3.DCT产生的系数很容易被量化,以获得好的块压缩;
4.DCT算法的性能很好,可以进行高效的运算,因此使它在硬件和软件中都容易实现;
5.DCT算法是对称的,逆 DCT算法可用来解压缩图像 。
4.4 静态图像压缩标准 —
— JPEG
4.4.2 量化所谓量化,即根据不同的要求,设置不同的量化等级,以降低数据率 。 量化的作用是在保证主观图像质量的前提下,丢掉那些对视觉效果影响不大的信息 。 量化是造成
DCT编码信息损失的根源 。
4.4.3 编码
相邻块的 DC系数进行差分编码
Z型路径的游程编码
熵编码
4.4.4 新一代静态图像压缩标准 ——
JPEG2000
JPEG2000 主要有以下特点:
高压缩率
同时支持有损和无损压缩
实现了渐进传输
支持,感兴趣区域,
4.5 视频图像压缩标准
MPEG
4.5.1 什么是视频视频就其本质而言,实际上就是一系列连续播放的静态图像而已 。 数字视频占用大量的存储空间,因为它要存储每一帧的像素
( 全速运动图像为 30帧 /秒 ) 和与之同步的伴音 。 视频压缩的目的是致力于使数字视频既少占空间,又要保证好的视觉效果 。 电视信号是视频的重要信息源 。
4.5 视频图像压缩标准
MPEG
4.5.2 MPEG家族
MPEG在三方面优于其他压缩 /解压缩方案 。
首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性 。 其次,MPEG能够比其他算法提供更好的压缩比,最高可达 200:1。 更重要的是,
MPEG在提供高压缩比的同时,对数据的损失很小 。
MPEG-1
MPEG-2
MPEG-4
MPEG-7
4.5 视频图像压缩标准
MPEG
4.5.3 MPEG压缩过程
MPEG标准的视频压缩主要以两个基本技术为基础,一是采用 DCT的帧内压缩,其目的是为了减少空间冗余度。二是采用基于运动补偿的帧间压缩技术,用以减少时间(运动)冗余度度。 MPEG压缩法将导致图像细节信息的丢失而产生压缩失真,使压缩图像的质量有所下降。 MPEG压缩算法有时会产生负面影响,使压缩后的画面出现马赛克(小方块)现象,MPEG压缩算法对那些低比度、光线柔和、边缘变化缓慢的视频图像具有较佳的压缩效果。
信息技术的核心在于信息的处理与存储 。 多媒体信息包括文本,图形,图像,声音等,由于这些媒体的信息量相当大,数字化后要占用大量的存储空间,使得存储与处理都十分困难 。
尤其在图像信息的存储和压缩方面,
其重要性作用表现得尤为明显 。
本章小结
在信息技术的几个环节(获取、传输、存储、
显示、处理)中,信息存储是重要的环节之一。
为减少数字化信息在存储和传输时所占用的空间和时间,数据压缩技术就成为信息处理中的关键技术之一。信息存储涉及到材料科学、电子学、光电子学、光子学以及计算机科学等,
是一个综合性的技术。通过本章的学习,读者应了解磁存储技术与光存储技术的主要特点,
理解图像压缩的基本概念,以及预测编码、变换编码和统计编码的主要思想,并对 JPEG和
MPEG的图像压缩标准及实现方法有一定的了解。
4.1 信息存储技术的三次革命
历史学家通常把文字的出现当做文明史的开端。
文字记载是人在大脑之外寻找记忆载体的方式。
通过记载,人的思想和关于历史事件传说得到保存、复制和流传。人们由此而有了历史。文字的出现是人类历史上第一次划时代的信息载体革命,这场革命的实质就是实现了脑外信息贮存方式。随着印刷术的应运而生,它是人类历史上规模空前的信息复制革命,可以说是继文字出现之后的第二次信息载体革命。科学史家通常把电讯业的出现当做人类历史上第三次信息 (载体 )革命。不过今天也有人把这一佳冠授予计算机和互联网。
4.2 计算机存储系统
4.2.1 信息存储技术的金字塔结构计算机的存储设备从体系结构上看可分为内存储器和外存储器 。 内存储器直接与计算机的 CPU相连,处于金字塔的最上层 。
它的存取速度要求能与 CPU相匹配,通常由半导体存储器芯片组成,由于成本高,
容量通常不太大 。 再下一层是邻机存储器,
它由存取速度比硬盘更慢的光盘机,光盘库等设备组成 。 磁盘 ( 包括软盘和硬盘 )
与光盘均提供联机服务 。 最底层是脱机存储器 ( 或称离线存储器 ),由磁带机和磁带库组成 。
4.2 计算机存储系统
4.2.2 磁存储技术磁存储技术就是利用磁介质的这一特性来存储信息的 。 数据 ( 声像 ) 以电信号的形式通过录制磁头转换成磁信号储存在磁性介质上 。 重放时,只要通过磁头将磁性介质上的磁信号还原成电信号,就可以在计算机屏幕上显示出信息 。
软磁盘存储
硬盘
磁盘阵列
磁带存储
4.2 计算机存储系统
4.2.3 光存储技术光存储介质与磁存储介质之间的本质区别在于前者使用光技术,而后者使用磁技术 。 光存储技术通过光学的方法读出和写入数据,由于使用的光源基本上是激光 (也可以使用其他光源 ),所以又称为激光存储 。 光盘具有一切存储介质的优点,如大容量,耐用,易保存,标准化等 。 由于它非常适合于大量生产,
作为计算机软件,多媒体出版物,计算机游戏等发行量大的电子出版物是非常合适的 。
4.3 图像数据压缩与编码技术
4.3.1 熵与信息压缩从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,
去除确定的信息 (可推知的 ),也就是用一种更接近信息本质的描述来代替原有冗余的描述 。 所以,将香农的信息论观点运用到图像信息的压缩,所要解决的问题就是如何将图像信息压缩到最小,
但仍携有足够信息以保证能复制出与原图近似的图像 。
4.3 图像数据压缩与编码技术
4.3.2 图像数据压缩的可能性多媒体视频信号的冗余度存在于结构和统计两方面 。 在结构上的冗余度表现为很强的空间 ( 帧内 ),和时间
( 帧间 ) 相关性 。
空间冗余
时间冗余
视觉冗余
4.3 图像数据压缩与编码技术
4.3.3 压缩编码方法的分类与评价压缩编码的分类方法有许多种,如果从信息论的角度来认识可分为两大类:
4.3 图像数据压缩与编码技术无损压缩是指数据在压缩或解压缩过程中不会改变或损失原有的信息,解压缩产生的数据是对原始对象的完整复制,没有失真。无损压缩从数学上讲是一种可逆运算。
有损压缩算法靠丢掉大量冗余信息来降低数字图像所占的空间,回放时也不能完整地恢复原始图像,而将有选择地损失一些细节,损失多少信息由需要多高的压缩率决定。
4.3.4 数据压缩编码技术的发展
第一代编码技术 —— 经典编码方法
1959年,Shannon进一步确立了码率失真理论,以上工作奠定了信息编码的理论基础 。 主要编码方法有预测编码,变换编码和统计编码,也称为三大经典编码方法 。 经典编码技术又可以称为,第一代,
编码技术 。
,第二代,编码方法
,第二代,编码方法主要有:基于分形的编码,基于模型的编码,基于区域分割的编码和基于神经网络的编码等 。
4.3.5 图像压缩编码方法数据的压缩都可以看成是一种变换,解压缩 (恢复数据 )就是一种反变换,变换的实现方法即编码技术,每一种编码方法都是实现数据压缩的具体操作,对于不同的多媒体数据,可以有选择地采取某种编码方法 。
预测编码
变换编码
统计编码
混合编码
图像与视频压缩标准
4.4 静态图像压缩标准 —
— JPEG
JPEG(念作,jay-peg”)是,The
Joint Photographic Expert Group”的缩写,它是由国际电报咨询委员会 (CCITT)和国际标准化组织 (ISO)联合组成的专家组,
共同制定的静态数字图像压缩标准。 JPEG
的算法的基础是离散余弦变换 (DCT)和哈夫曼 (Huffman)变换,其压缩过程可分成 DCT
变换、量化和编码三个阶段。
4.4 静态图像压缩标准 —
— JPEG
4.4.1 离散余弦变换离散余弦变换 (Discrete cosine
Transform),简称 DCT。它是变换编码中的一个非常重要的成员。
DCT的优点很多,主要表现为:
1.已证明 DCT是许多图像的最佳变换 ;
2.DCT可以将N × N图像的空间域转换为频率域,
只需要少量的数据点表示图像;
4.4 静态图像压缩标准 —
— JPEG
3.DCT产生的系数很容易被量化,以获得好的块压缩;
4.DCT算法的性能很好,可以进行高效的运算,因此使它在硬件和软件中都容易实现;
5.DCT算法是对称的,逆 DCT算法可用来解压缩图像 。
4.4 静态图像压缩标准 —
— JPEG
4.4.2 量化所谓量化,即根据不同的要求,设置不同的量化等级,以降低数据率 。 量化的作用是在保证主观图像质量的前提下,丢掉那些对视觉效果影响不大的信息 。 量化是造成
DCT编码信息损失的根源 。
4.4.3 编码
相邻块的 DC系数进行差分编码
Z型路径的游程编码
熵编码
4.4.4 新一代静态图像压缩标准 ——
JPEG2000
JPEG2000 主要有以下特点:
高压缩率
同时支持有损和无损压缩
实现了渐进传输
支持,感兴趣区域,
4.5 视频图像压缩标准
MPEG
4.5.1 什么是视频视频就其本质而言,实际上就是一系列连续播放的静态图像而已 。 数字视频占用大量的存储空间,因为它要存储每一帧的像素
( 全速运动图像为 30帧 /秒 ) 和与之同步的伴音 。 视频压缩的目的是致力于使数字视频既少占空间,又要保证好的视觉效果 。 电视信号是视频的重要信息源 。
4.5 视频图像压缩标准
MPEG
4.5.2 MPEG家族
MPEG在三方面优于其他压缩 /解压缩方案 。
首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性 。 其次,MPEG能够比其他算法提供更好的压缩比,最高可达 200:1。 更重要的是,
MPEG在提供高压缩比的同时,对数据的损失很小 。
MPEG-1
MPEG-2
MPEG-4
MPEG-7
4.5 视频图像压缩标准
MPEG
4.5.3 MPEG压缩过程
MPEG标准的视频压缩主要以两个基本技术为基础,一是采用 DCT的帧内压缩,其目的是为了减少空间冗余度。二是采用基于运动补偿的帧间压缩技术,用以减少时间(运动)冗余度度。 MPEG压缩法将导致图像细节信息的丢失而产生压缩失真,使压缩图像的质量有所下降。 MPEG压缩算法有时会产生负面影响,使压缩后的画面出现马赛克(小方块)现象,MPEG压缩算法对那些低比度、光线柔和、边缘变化缓慢的视频图像具有较佳的压缩效果。