数字图像处理与分析基础
第七章 图像编码技术
黄爱民 安向京 骆力
中国水利水电出版社
新世纪电子信息与自动化系列课程改革教材
ISBN7-5084-2930-3
数字图像处理与分析基础
第七章 图像编码 Image Coding
? 压缩目的
? 基本原理
? 基本方法
? 图像编码标准
数字图像处理与分析基础
7.1 编码的目的
? 减少数据量:存储量、传输时间
例 1:一般彩色电视信号,YIQ色空间中各分量的带宽
分别为 4.2MHz,1.5MHz,0.5MHz,采样原理,采
样频率 >=2倍原始信号频率,量化为 8bit,1秒钟的
数据量为 (4.2+1.5+0.5)*2*8=99.2MBits,约为
100Mbits/S,
1GB的 CD-ROM存 1分钟的原始电视节目。
HDTV数据量约为 1.2GBits/S,1GB存 6秒钟 HDTV。
彩色静止图像,3*1024*1024*8=3MB,
数字图像处理与分析基础
图像通信的一般过程
图像
采集
信源
编码 信道编码
信道
解码
信源
解码
图像
显示或
存储
图像
通信
数字图像处理与分析基础
基本概念
? 信源
? 需要传输或存储的原始信息称为,信源,。包括语
音、图像、视频等信息源。
?, 信源编码,的主要任务是利用一定的编码方法降
低 数码率,即 比特率 。
? 信道
? 信息传输的通路;
? 信息在传输中要增加可靠性、抗干扰能力,就要进
行,信道编码,,此时要进行 奇偶校验 等检测,需
要增加比特数。抗干扰能力越强,增加的比特数就
越多。
数字图像处理与分析基础
图像编码压缩要研究的主要内容
? 信源压缩方法
? 与信源模型有关
? 语音,线性模型
? 比特率
? 采样速率(每秒样本数)乘以样本精度
(比特 /样本)
? 逼真度准则或失真度准则
? 平方误差准则
? 基于主观感受的逼真度准则
数字图像处理与分析基础
4、编码准则
输入图像 f(x,y),输出 g(x,y),x,y=0,1,2,…,N-1,
( 1)均方误差:
? ??
?
?
?
?? 1
0
1
0
2
2 )],(),([
1 N
x
N
y
yxfyxgNM S E
( 2)均方根信噪比:
2/1
1
0
1
0
2
1
0
1
0
2
)],(),([
),(
)(
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
? ?
?
?
?
?
?
?
?
?
N
x
N
y
N
x
N
y
r m s
yxfyxg
yxg
S N R
( 3)压缩比 =
原图像编码每个象素平均所需 bit数 / 压缩后象素平均所需 bit数
保真度准则:主观保真度准则、客观保真度准则。
客观保真度准则:图像均方误差、均方根信噪比。
数字图像处理与分析基础
主观保真度准则
评分 评价 说明
1 优秀 图像质量非常好
2 良好 图像质量高,观看舒服,有干扰但不影响观看
3 可用 图像质量可接受,有干扰但不太影响观看
4 刚可看 图像质量差,干扰有些影响观看,希望改进
5 差 图像质量很差,干扰严重妨碍观看
6 不能用 图像质量极差,不能使用
数字图像处理与分析基础
7.2 图像压缩的基本原理
? 1,压缩的根据, 图像数据量 >>信息量
I=D-du,I( 信息量),D(数据量),du(冗余量)
保留意义完全的信息,支持查询与检索。
冗余 (redundancy)信息和不相干 (irrelevancy)的信息。
数字图像处理与分析基础
压缩率
用 n1表示一幅图像原来的数据量,n2表示压缩后
的数据量,
压缩率 Cr 定义为:
Cr= n1/ n2 ( 7-2)
冗余量 Rd 可表示为:
Rd=1-1/Cr ( 7-2)
数字图像处理与分析基础
7.2,2数据冗余的类型
? 编码冗余
? 像素间冗余
? 心理视觉冗余
数字图像处理与分析基础
1、编码冗余(信息熵冗余)
?,码本” 是表示一组信息或一组事件的一系列符
号(如字母、数字等)。其中对每个信息或事
件所赋予的符号成为,码字”,每个码字含有
的基本符号的个数称为,码长” 。
? 设 l(rk)为码字 rk的码长,在二进制表示时称为
“比特数( bits)”,Pr(rk)为码字的出现概率。
若编码系统共有 L种不同的码字,则系统可获得
的平均比特数为:
?
?
?
?
1
0
)()(
L
k
krka v g rprlL
数字图像处理与分析基础
? 自然码,如表示 256个不同的灰度级,就用
8bits的等长的二进制数据来编码每一个灰度级,
这样系统的平均码长就是 8bits。
? 定理:当 l(rk)根据 pr(rk)降序设计成变长编码的
形式时,平均码长最小。
数字图像处理与分析基础
等长编码与非等长编码比较
rk pr(rk) 编码 1 L1(rk) 编码 2 L2 (rk) 编码 3 L3 (rk)
r0=0 0.02 000 3 00 2 111101 6
r1=1/7 0.25 001 3 01 2 00 2
r2=2/7 0.06 010 3 10 2 1110 4
r3=3/7 0.16 011 3 1100 4 1100 4
r4=4/7 0.08 100 3 1101 4 1101 4
r5=5/7 0.21 101 3 1110 4 01 2
r6=6/7 0.03 110 3 111100 6 111100 6
r7=1 0.19 111 3 111101 6 10 2
平均码长 3 3.78 2.8
数字图像处理与分析基础
2、像素间冗余
( 1) 空间冗余,规则物体和规
则背景的表面物理特性具有相
关性。
空间冗余
时间冗余
( 2) 时间冗余,序列图像
像素的灰度级和颜色之间具
有相关性,随机场模型
数字图像处理与分析基础
( 3) 结构冗余,纹理结构
( 4) 知识冗余,人脸的固定结构。
空间冗余、时间冗余又称 统计冗余,将图像信
号作为概率信号时的统计特性。
数字图像处理与分析基础
3、心理视觉冗余
? 视觉系统非线性、非均匀
? 分辨率约 26,图像量化 28
? 动态图像的视觉延迟现象
数字图像处理与分析基础
7.2.3 编码方法的分类
? 由压缩数据恢复的图像与原始图像的差别
?, 可逆压缩,:编码的数据可完恢复出原始图像
?, 熵编码,( Entropy Coding),,无失真编码,、
,无误差编码,( Error Free Coding), 无噪声编
码, (Noiseless)、,冗余度压缩,( Redundancy
Reduction)、,数据紧缩,( DATA Compaction
Lossless Bit-Preserving)。
?, 不可逆压缩,:, 有失真编码,( lossy
Coding),采用这类编码方法,由编码数据恢复
的图像与原始图像有区别,图像编码产生的误差与
编码的方法以及压缩比等因素有关。
数字图像处理与分析基础
1、“第一代”编码技术
? 三大经典编码方法
?,熵值编码”
?,预测编码”
?,变换编码”。
数字图像处理与分析基础
“熵值编码”
? (概率匹配编码)
? 主要针对无记忆信源,根据信息码字出
现概率的分布特征,寻找概率与码字长
度间的最优匹配,从而进行压缩编码,
又称为 统计编码 。
? 游程编码,Huffman编码和算术编码等
多种。
? 熵值编码是信息编码的基础,也是各种
实用算法的一个基本组成部分。
数字图像处理与分析基础
“预测编码”
? 根据数据的统计特性得到预测值,然后传
输图像像素与其预测值的差值信号,使传
输的码率降低,达到压缩的目的。
? 预测编码方法简单经济,编码效率较高,
是语音的基本编码方法。
? 预测编码分为线性预测编码、非线性预测
编码。根据处理的信息维数不同,又可分
为行内编码(一维)、帧内编码(二维)
以及帧间编码(三维)。
? 预测编码是视频图像压缩的基础。
数字图像处理与分析基础
“变换编码”
? 进行某种正交变换来消除像素间的相关
性。
? 可分为最佳变换编码,如 K-L变换,以及
次优变换编码,如离散余弦变换( DCT)
等。
? 在实施时,辅助以区域变换编码、门限
变换编码。
? 基于离散余弦变换的静止图像压缩标准
jpeg和运动图像压缩标准 mpeg等一系列
标准。
数字图像处理与分析基础
“自适应编码”
? 从本质上来说就是一种“混合编码”方案,它
在不同阶段根据图像的不同特征将变换编码、
预测编码、无误差编码等各种方案的优势综合
利用起来。
? 关键是识别图像的特征。
? 多种方案的复用可实现多级压缩,已经可以得
到较大的压缩比了,现有的图像压缩标准
JPEG,MPEG等在设计中就利用了这种思路。
数字图像处理与分析基础
2、第二代编码技术
? 要充分利用人的视觉生理、心理特征和图像信源
的各种特征,实现从,波形,编码到,模型,编
码的转变,以便获得更高压缩比。
? 向量量化编码, 基于分形的编码、基于模型的编
码、基于区域分割的编码、基于神经网络的编码
以及识别编码和基于知识的编码等。
数字图像处理与分析基础
3、过渡编码技术
? 充分利用人类视觉特性的“多分辨率编码”
方法,如子带编码、金字塔形编码和基于
小波变换的编码。
? 这类方法原理上仍属于线性处理,属于
“波形”编码,可归入经典编码方法,但
它们又紧密结合人类视觉系统的特性,因
此可以被看作是“第一代”编码技术向
“第二代”编码技术过渡的桥梁。
数字图像处理与分析基础
子带编码技术:
? 子带编码是一种高质量、高压缩比的图像编码方法,
它早已在语音信号压缩编码中获得了广泛的应用。
? 其基本依据是:图像信号可以划分为不同的频域段,
人眼对不同频域段的敏感程度不同。例如图像信号的
主要能量集中在低频区域,它反映图像的平均亮度;
而细节、边缘信息则集中在高频区域。
? 子带编码的基本思想是利用一滤波器组,通过重复卷
积的方法,将输入信号分解为高频分量和低频分量,
然后分别对高频和低频分量进行量化和编码。解码时,
高频分量和低频分量经过插值和共轭滤波器而合成原
信号。
? 进行子带编码的一个关键问题,是如何设计共轭滤波
器组,除去混叠频谱分量。
数字图像处理与分析基础
小波变换编码技术
? 小波变换编码技术是目前的研究热点。小波变换它不仅为
多分辨分析、时 -频分析和子带编码建立了统一的分析方
法,而且提供了更合理的表示框架。
? 目前小波变换在图像编码中的应用研究主要课题有:正交
小波基的选择(小波包法)、小波变换与各种量化方式的
结合、小波变换在分形法中实现初级分形、小波变换用于
运动估值等方面。
? 小波变换法处于图像编码当前首选方法的位置,一方面,
它有快速算法,实现起来简单方便、速度快,可暂时弥补
“第二代”编码技术的不足;另一方面,它有着先进的分
析方法,可有效提高现有技术的水平,实现突破性进展。
数字图像处理与分析基础
4、第三代编码技术
? 在第三代编码方案中主要提出了基于运
动模型( VR)的编码概念,主要针对
提高电视会议、可视电话等的图像效果。
数字图像处理与分析基础
编码
算法
PCM
预测
编码
变换编
码 付立叶变换 斜变换 小波变换
统计
编码 Huffman编码 算术编码 游程编码
其他编

静态图像
编码
二值图像编

子带编码 轮廓编码
图 7-1 常用图像编码算法分类
固定 自适应
固定 自适应
离散余弦变换 KL变换
沃尔什
哈达马 Harr变换
LZW
比特平面 逐渐浮现 逐层内插
方块 抖动
视频
图像
内插 运动补偿 条件补充
运动估计 帧间预测
帧内预测
帧间编码
矢量量化
数字图像处理与分析基础
7.2.4 简单的图像编码模型
信源
PCM信
息源编
码器
信道编
码器
通讯线路或存储媒体
图像通讯和编码压缩原理框图
压缩编
码器
信宿 PCM解码器
信道解
码器
压缩解
码器
编码
部分
解码
部分
数字图像处理与分析基础
( 1)信源编码器和信源解码器
原始图像 映射变换
(信息抽取)
映射
后数
据 量化器
符号编码器
(码元分配)
码字
图像数据压缩的一般过程(信息源)
符号解码器
(原始符号表示)
反映射器
(信息恢复)
输出图像
图像数据解压缩的一般过程(信息源)
映射器,将输入数据从象素域变换到另一个域中。
量化器,将每个映射数据舍入为数目较少的可能数值。
均匀、非均匀
数字图像处理与分析基础
( 2)信道编码器和信道解码器
汉明( Hamming)编码:正确的码字之间的最小距离
要大于一个给定值
码字以二进制形式表示,比特( bit)
D((101),(110))=2
汉明,将 3个比特位的冗余加到 4比特的码字上,任意
两个正确码字间的距离为 3,可发现和校正错误。
数字图像处理与分析基础
例,4bit(b3b2b1b0)~7bit(h1h2h3h4h5h6h7)
07
160124
250132
330231
bh
bhbbbh
bhbbbh
bhbbbh
?
????
????
????
76544
76322
75311
hhhhc
hhhhc
hhhhc
????
????
????
h1,h2,h4分别是比特区
h3b2b0,b3b1b0,b2b1b0的
偶校验位。
信道解码器对已建立偶校验的比
特区进行检查,由 c1,c2,c4指
出错误,从校正后的 h3h5h6h7
得到正确值。
数字图像处理与分析基础
7.3 编码器和典型的编码方法
编码器,给每一量化器的输出分配一个码字。
等长码、非等长码、唯一可译码、瞬时码
编码器X={x1,…,xn} W={w1,…,wn}
A={a1,…,an}
图 7-4 编码器的描述
X:信号源; A:构成码字的符号集, a称为码元 ; W:代码
信号源,象素灰度、行程长度、方向码、预测误差、变换系
数、上一过程的结果,等等。
数字图像处理与分析基础
码字的形式
? 二进制码:码元数等于 2时的代码称为二进制码。
? 等长码:如果码字集合 W中的所有码字都具有相同
的长度,就是等长码。如自然二进制码。码长不等
的就称为非等长码,如 Huffman码。
? 唯一可译码(单义码):如果任何长度的一段代码
只能分割成唯一的一个码字集合,则为唯一可译码。
如 W={0,10,11},对代码序列 S={100111000},只
能分割成 10,0,11,10,0,0。
数字图像处理与分析基础
? 在编码中形成的代码集合必须是单义
码,否则没有实际使用价值。
? 非续长代码:码字集合中的任何一个码字都
不是另一个码字的续长。如
W={0,10,100,111}就不是非续长代码,其中
,100”是,10”的续长。非续长代码一定是
单义码,但单义码不一定是非续长代码。如
W={0,01}是单义码,但又是续长代码。非续
长代码可以用树型结构构造。
数字图像处理与分析基础
构造非续长码
? 设 A={0,1},W={w1,w2,w3,w4}
w4
0
w1
w2
w4w3
0
0
1
1
10
(a)
w1
w2
w3
1
1 0
01
(b)
图 7-5非续长代码的树型图
1,设置根节点,从根节点开始分枝,每条分枝代表一个码
元 0或者 1,取其中任意一个分枝的节点代表 w1。
2,对没有被选作代码的节点
再分枝,选择其中任意一
个分枝的节点作为代码
w2。
3,依次类推,至所有节点都
代表一个码字结束。
数字图像处理与分析基础
4、按照分枝顺序构成各码字:
w1=0,w2=10,w3=110,w4=111。
各码字的长度为:
n1=1,n2=2,n3=n4=3。
树形图说明,被选作代码的节点不会再有分支,
因此形成的必然是非等长的非续长代码。
数字图像处理与分析基础
7.3.2无噪声编码定理
? Shannon的信息论
? 如何构造码字,才能得到最短的平均码长?
? 对特定的信息源,平均码长有下限吗?
? 随机事件提供的信息量,与事件的出现
概率有关。
数字图像处理与分析基础
)(EI 称为 E的自信息。
1?p ( E ) (即事件总是发生),那么,
0)( ?EI
结论:确定的事件没有提供任何新的信息,而偶然
发生的事件,提供的信息量比较大。
设有随机事件 E,它的出现概率是 p(E),那么它
包含的信息量为:
)(lo g)(1lo g)( EPEPEI ???
如果
数字图像处理与分析基础
那么信息源 X={xj,j=1,2,3,…,n}
提供的信息量定义为:
??
??
??????
n
j
jj
n
j
jj xPxPxIxPEIEXH
11
)(l o g)()()()}({)(
?
?
?
n
j
jxP
1
1)(
H(X)
H(X)称 为信息的“熵”,它定义了信息的平均信息
量(每单位字符)。熵值总是非负的,当构成信息
源的所有事件的概率都相等时,熵值最大。如果对
数的底是 2,那么信息熵的度量单位就是比特 ( bits
per symbol)。
数字图像处理与分析基础
)( )(xL xH??
其中 H(x)为信号的信息为熵,L(x) 为编码的平均
长度。
这种编码方法的冗余 度为
?
?? ??1
如果某种编码方法产生的平均字长等于信息源的
熵,那么它就没有任何冗余信息,达到了编码的
最优状态。这时要求:
)(lo g)( jj xPxL ??
某种编码方法的编码效率定义为
)(
)(
xL
xH??
?? ?? 1
)(l o g)( jj xPxL ??
数字图像处理与分析基础
“Shannon(香农)第一定理”
?“无噪声编码定理”,也就是,Shannon(香农)
第一定理”。
?信息的码字长度与它的出现概率成反比,大概率事件
的码长较短,小概率事件的码长较大,严格按照这个规
律构造非等长码,就可以获得概率统计意义上最优的编
码。
?平均码长的下限是,对二进制编码而言,只有当所有
符号的出现概率等于 2的负整数幂时,(如 0.5,0.25
等),才能达到下限。
?信息的出现概率在实际应用中很难获得,一般是
用它的频率代替。
数字图像处理与分析基础
7.3.3几种典型的统计编码方法
? 根据信息熵的理论,将信息出现的概率
模型引入编码模型中,得到概率意义下
最优编码
? 最常用的
? 霍夫曼码
? 对数码
? 移位码
? 算术编码等。
数字图像处理与分析基础
1、霍夫曼码 (Huffman)
基本思想:
统计信号的概率分布模型,然后按信号出现的概率
赋予信号不同的码长。出现概率大的信号赋予较短
的码字,出现概率小的,赋予较长的码字。
数字图像处理与分析基础
算法
? ( 1)统计输入信号的概率(如对一幅图像或 M幅同
种类型图像进行灰度分布概率统计),得到 N个不同
概率的信息符号;
? ( 2)将 N个输入信号按照它们的出现概率由大到小
排列;
? ( 3)合并两个概率最小的信号,形成一个新的信号。
新信号的概率是这两个信号的概率和。这时概率减少
为 N-1个;
? ( 4)在形成新概率集合后重新排列;
? ( 5)重复第 4步,至只剩两个概率序列为止;
? ( 6)以二进制码元( 0,1)赋值,形成非续长代码
树。注意,最好按统一规律分配码元,这样解码时更
易于理解。
? ( 7)霍夫曼代码的产生从根节点开始,反向进行。
数字图像处理与分析基础
? 霍夫曼码举例
例, H-C P
?1 1 0.4
?2 00 0.3
?3 011 0.1
?4 0100 0.1
?5 01010 0.06
?6 01011 0.04
1 1
0
0
1
0.6
0.3
0.2
0.10
1
0
1
0
0
1
L=?k=1,M? kP(? k)
=1(0.4)+2(0.3)+3(0.1)+4(0.1)+5(0.06)+5(0.04)=2.20 bits
H= - ?k=1,M P(ak)log P(ak)
= -0.4log(0.4)-0.3log(0.3)-0.1log(0.1)-0.1log(0.1)-
0.06log(0.06)-0.04log(0.04)=2.14 bits
数字图像处理与分析基础
霍夫曼码是最佳编码:
按给定的概率分布构成的最短的代码 --与概
率分布相匹配的编码。
编码效率:
?= H(x)/ L(x)= 2.14/2.20=0.97
缺点:
1、强烈依赖于概率结构,工作量大。
2、码字变化大,结构复杂,实现困难。
数字图像处理与分析基础
2,B码(对数码)
概率服从乘幂定律时最佳,
Pk=k-r,k=1,2,..,M,r?N
两部分构成:一半延续比特 C、一半信息比特 B
(采用长度增长的自然码),CB
C=0/1,C同,则还是同一码字; C变,则新的码字
开始。 Bn:每一延续比特,有 n个信息比特。
例 1,B1:c0 c1 B2:c00 c10 c11 c01
例 2,?1 ?8 ?5 B1,001010110100
数字图像处理与分析基础
3,S码(移位码,shift code)
两部分,CS,基本码 S、移位信息 C。 Sn中 n表示基
本码字的长度。 2n中有 2n -1个基本码字,一个移位
信息。
例,S2码
?1,C1 00 ?2,C2 01 ?3,C3 10
?4,C4C1 1100 ?5,C4C2 1101
?6,C4C3 1110 ?7,C4C4C1 111100
特点:易于实现,对单调减小概率相当有效。
数字图像处理与分析基础
算术编码是 60年代初期 Elias提出, 由 Rissanen
和 Pasco首次介绍了它的实用技术, 在信源概率
分布比较均匀情况下, 它的编码效率高于哈夫
曼编码 (5%),没有变换编码对数据输入分块的
要求, 在 JPEG扩展系统中用它来取代哈夫曼编
码 。
4,算术编码 (Arithmetic)
数字图像处理与分析基础
1、算术编码原理
? 将被编码的信源消息表示成实数轴 0~1
之间的一个间隔 (Interval)(也称子区间 ),
消息越长,编码表示它的间隔就越小,
表示这一间隔所需的二进制位数就越多。
信源中连续符号根据某一模式生成概率
的大小来缩小间隔。
数字图像处理与分析基础
[例 ] 已知信源,
??
?
??
??
4/34/1
10X
① 二进制信源符号只有两个,0”和,1”,设置
小概率 Pc= 1/4,大概率 Pe=1-Pc= 3/4
② 设 C为子区的左端起始位置,L为子区的长度 (等效于符号概
率 ),根据①:
符号,0”的子区为 [0,1/4);,0”的子区左端 C= 0,
子区长 L= 1/4;
符号,1”的子区为 [1/4,1);,1”的子区左端 C= 1/4,
子区长 L= 3/4。
试对 1011进行算术编码。
算术编码过程
数字图像处理与分析基础
③ 在编码运算过程中,随着消息符号的出现,子区
按下列规则缩小。
规则 A:新子区左端=
前子区左端十当前子区左端 × 前子区长度;
规则 B:新子区长度 =
前子区长度 × 当前子区的长度。
④初始子区为 [0,1),即 0< =x< 1
数字图像处理与分析基础
步序 符号 C L
(1) 1 1/4 3/4
(2) 0 1/4+0*3/4=1/4 3/4*1/4=3/16
(3) 1 1/4+1/4*3/16=19/64 3/16*3/4=9/64
(4) 1 9/64+1/4*9/64=85/256 9/64*3/4=27/256
最后的子区左端 (起始位置 ) C= (85/256)d=(0.01010101)b
最后的子区长度 L= (27/256)d= (0.00011011)b
最后的子区右端 (子区间尾 )= (7/16)d=(0.0111)b
编码结果:子区间头尾之间取值,其值为 0.011,可编码为 011,
原来 4个符号 1011被压缩为三个符号 011。
解码过程:是逆过程,首先将区间 [1,0)按 Pc靠近 0侧,Pe靠近
1侧分割成两个子区间,判断被解码字落在哪个子区,而赋予对
应符号。
数字图像处理与分析基础
( 1)算术编码的模式选择,直接影响编码效率,有
固定模式,也有自适应模式。
( 2) 算术编码的自适应模式,无需先定义概率模型,
对无法进行概率统计的信源合适,在这点上优越于哈
夫曼编码。
( 3) 在信源符号概率接近时,算术编码比哈夫曼编
码效率高。
( 4) 算术编码硬件实现比哈夫曼编码要复杂些。
( 5) 算术编码在 JPEG的扩展系统中被推荐代替哈夫
曼编码。
算术编码的特点
数字图像处理与分析基础
小结
? 编码器,不可缺少
? 变长编码
? 统计编码
? 实现困难