2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
1
第七章 图象编码
图象编码分类
图象编码中的保真度准则
PCM编码 (Pulse Code Modulating)
统计编码
预测编码
变换编码
其它一些压缩编码方法
静态图象的一些主要数据文件压缩方式
图象压缩的国际标准
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
2
7.1图像编码分类编码是把模拟制信号转换为数字制信号的一种技术,图像编码技术不仅是应用线性脉冲编码调制法(线性 PCM),
而更主要的是利用图像信号的统计特性以及视觉对图像的生理学和心理学特性对图像进行信源编码。
在信息论中,将通信过程概括为下图:
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
3
信源编码,
对信源实现压缩、加密等一系处理,使处理后的信号更适合于数字通信系统。在编码过程中尽量提高编码效率,力求用最少的数码传递或存储最大的信息。
信道编码,
任务是解决可靠性问题,是尽量使处理过的信号在传输过程中不出差错或少出差错,即使出了差错也要有能力尽量纠正错误。
图像编码属于信源编码的范畴。
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
4
目前实用的编码方法可以可以分为三大类:即预测编码,变换编码及统计编码。而这些方法既适用于静止图像编码,世适用于电视信号编码。
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
5
7.2图像编码中的保真度准则图像信号在编码和传输过程中会产生误差,尤其是在有损压缩编码中,产生的误差应在允许的范围之内 。 在这种情况下,
保真度准则可以用来衡量编码方法或系统质量的优劣 。 通常,
这种衡量的尺度可分为客观保真度准则和主观保真度准则 。
7.2.1客观保真度准则通常使用的客观保真度准则有输入图像和输出图像的均方根误差;输入图像和输出图像的均方根信噪比两种 。 输入图像和输出图像的均方根误差是这样定义的,设输入图像是由 N× N
个像素组成,令其为 f(x,y),其中 x,y=0,1,2,…,N-1。 这样一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像,这里令重建图像为 g(x,y)。 它同样包含 N× N个像素,
并且 x,y=0,1,2,…,N-1。
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
6
在 0,1,2,…,N -1范围内 x,y的任意值,输入像素和对应的输出图像之间的误差可用下式表示:
而包含 N× N像素的图像之均方误差为由式方 (5-2)可得到均方根误差为
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
7
如果把输入、输出图像间的误差看作是噪声,那么,重建图像 g(x,y)可由下式表示:
在这种情况下,另一个客观保真度准则 —— 重建图像的均方信噪比如下式表示:
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
8
均方根信噪比为
7.2.2主观保真度准则图像处理的结果,绝大多数场合是给人观看,由研究人员来解释的,因此,图像质量的好坏与否,既与图像本身的客观质量有关,也与人的视觉系统的特性有关 。 有时候,
客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保真度准则,这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观质量 。 另外一种方法是规定一种绝对尺度,
例如:
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
9
1) 优秀的具有极高质量的图像;
2) 好的是可供观赏的高质量的图像,干扰并不令人讨厌;
3) 可通过的图像质量可以接受,干扰不讨厌;
4) 边缘的图像质量较低,希望能加以改善,干扰有些讨厌;
5) 劣等的图像质量很差,尚能观看,干扰显著地令人讨厌;
6) 不能用图像质量非常之差,无法观看 。
另外常用的还有两种准则,即妨害准则和品质准则 。
妨害准则如下五级:
1) 没有妨害感觉;
2) 有妨害,但不讨厌;
3) 能感到妨害,但没有于扰;
4) 妨害严重,并有明显干扰;
5) 不能接收信息 。
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
10
品质准则如下七级:
1) 非常好;
2) 好;
3) 稍好;
4) 普通;
5) 稍坏;
6) 恶劣;
7) 非常恶劣 。
总之,主观保真度评价方法的准则可不同,但其基本原理都一样,当然,对观察者的视觉条件应有一定的要求 。
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
11
7.3 PCM编码
7.3.1 PCM编码的基本原理脉冲编码调制 (Pulse Coding Modulation,PCM)是将模拟图像信号要为数字信号的基本手段 。 图像信号的 PCM
编码与语音信号 PCM编码相比并没有原则上的区别,但是,图像信号,特别是电视信号占的频带宽,要求响应速度快,因此,电路设计与实现上有较大的难度 。
脉冲编码调制 ( 即 PCM编码 ) 是将模拟图象信号变为数字信号的基本手段 。 其基本框图如下:
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
12
第一级低通滤波器其作用有两个,一是为满足取样定理的带宽要求(采样速度应高于最高速度的两倍( Nyquist
定理),或最高频率不能高于采样频率的 1/2),以减少折迭误差。二是对杂散噪声也有一定的抑制作用(噪声一般都处在高频端)
量化器的任务是把模拟信号的幅值离散化。经取样与量化处理后就可产生多值数字信号。编码的任务是把多值的数字信号变成二进制数字的多比特信号,以便传输或进行后续处理。译码器的原理比较简单,它包括一个译码电路和一个低通滤波器。译码器把数字信号恢复为模拟信号,
这个模拟信号就是在接收端重建的图像信号。
在量化过程中,量化误差形成量化噪声。量化误差是量化最小单位的 1/2。量化噪声是不可恢复的。
另外,当输入幅值超过量化最大值时,还会产生过载噪声
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
13
对于常规编码来说,减少量化分层数就可以降低存储量和传输比特速率 。 但是,量化分层数的最小值应满足图像质量的要求 。 当主观评定图像质量时,为了防止伪轮廓效应,量化分层数必须足够大 。 实践证明,对于线性 PCM编码,黑白图像要 6~ 7bit,相当于分层数为
64~ 128层,彩色复合编码要 8bit,即 256个量化分层,这样恢复的图像才能与原模拟图像相比拟 。 如果码位不够,
就会出现明显的伪轮廓 。
7.3.2 编码器、译码器编码器的任务是把一个多值的数字量用多比特的二进制量来表示。如果量化器输出 M个值,那么,对应于 M
个值中的任何一个值编码器将给定一个二进制码字。这个码字将由 m个二进制数组成。通常情况下 M=2m。编码器的输入与输出关系是一一对应的,其过程是可逆的,
因此,不会引人任何误差。
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
14
7.3.3 非线性 PCM编码在线性 PCM编码中,量化阶是均匀的,这样,在小信号输入的情况下信噪比较低,在大信号输入的情况下信噪比较高 。 为了改善小信号在量化过程中的信噪比,采用一种瞬时压缩扩张技术 。 这种技术实际上是降低大信号时的信噪比提高小信号时的信噪比,其结果是在不增加数码率的情况下,使信号在整个动态范围内有较均衡的信噪比 。
一种方案是数字化非线性压扩技术,其原理框图如下图所示。对于小信号和大信号使用不同的量化宽度。
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
15
2009年 7月 24日 数字图象处理演示稿 纪玉波制作
(C)
16
这种方案是把编码与压缩,译码与扩张都分别在编码和译码中一次完成,数字式非线性编码的压扩特性有 μ特性,A特性等等 。 根据 CCITT1970年的建议,
通常采用 13折线的压扩特性 。 13折线压扩特性如图所示 。 由图中可见,各段折线的斜率是不一样的; 4
至 8段的小信号区的信噪比都得到了改善,图中的 uin
表示压缩器的输入,uout表示压缩器的输出,V为过载点电压 。 图中只画出了信号在正半周时的情况,负半周时也一样 。 由于正半周的 7,8两段和负半周的 7、
8两段斜率都一样,所以在整个特性中这 4段连成一条直线 。 因此,总共有 13条直线段,简称 13折线 。