第九讲 图像压缩标准的混合编码
3.4 图像压缩标准的混合编码
3.4.1 JPEG编码标准
1,JPEG标准的总体目标
2,有失真编码模式
3,JPEG混合编码的一般过程
3.4.2 MPEG编码标准
1,MPEG系统的参考框架
2,MPEG-1混合编码过程
3,MPEG-2混合编码说明
3.4.3 H.261编码标准
3.4 图像压缩标准的混合编码
3.4.1 JPEG编码标准
1.工作模式与实现方案工作模式:无失真编码;顺序编码;累进编码;分层编码实现方案:四种编码模式构成两种基本的压缩算法组合方案
① 基于 DPCM的无失真编码方案:
DPCM预测编码 + Huffman编码/算术编码用于保证压缩恢复的实时解码性能,以满足高保真度要求
② 基于 DCT的有失真编码方案,用于大幅度提高压缩比
2,有失真编码模式
⑴ 顺序编码模式:针对最小编码单元 ( MCU) 的
DCT变换输出,即 8× 8系数矩阵,
从左到右,从上到下,一次扫描完成压缩编码扫描方式:逐行扫描,隔行扫描输入处理:值域层平移,[0,2P-1]→[ -2P-1,2P-1-1]
P为采样精度,P={ 8bit,12bit,16bit }
⑵ 累进编码模式,在顺序编码方法的基础上,
改进编码操作的扫描方式由粗到细,逐次累加,渐近压缩;
编码过程需经多次扫描才能完成解压时,信号由模糊逐次清晰累进编码定义了两个互补过程,分频累进 ; 按位累进
① 分频累进法,把单元块的 64个 DCT系数,按 Z形扫描方式,
分割成不同频段及不同分量 ( DC,AC) 分组的多个频率带;
然后分开扫描,按 DC系数和 AC系数分开编码;
再将 AC系数按 3个一组进行频谱选择分组;频带集 G为:
G= {( 1,2,3),( 4,5,6),… ( 61,62,63) }
然后进行累进操作,每次扫描选择某些系数进行编码和传送
② 按位累进法,按 DCT系数的量化精度表示位 ( bit)
进行分段累进扫描,对于 8位精度,按位分段的位码集为:
B= {( 7,6,5,4),3,2,1,0 } → 累进操作
⑶ 分层编码模式适用场合,用低分辨率设备,显示或存取高分辨图像基本思想,源图像的每个分量用多帧形式表示 —
非差分帧后跟差分帧串;每帧按空间分辨率进行分层,
使分辨率沿水平和垂直扫描方向,以 22(n-1)倍率关系下降,
再对分层后的低分辨率图像进行编码解码时,按 2的倍数因子即 22(n-1)规律,
把分辨率提升;
并用插值方法进行图像恢复分层编码的基本过程:
① 按像元的两维空间分层关系,把源图像的分辨率降低
② 选用顺序,累进或无失真编码模式,
对已降低分辨率的图像进行扫描编码
③ 对低分辨率图像进行解码,以从低层开始重建图像
④ 用插值滤波器提高重建图像的分辨率,
并作为源图像的预测值;
所形成的差分值,
采用选定模式 { 顺序,累进,无失真 }进行编码
⑤ 重复第 ③ ~ ④ 步,直至图像达到原来的分辨率
3.JPEG混合编码的一般过程
⑴ DCT变换
① 数据分块:对输入的静止图像进行分割,
以降低计算复杂性和存储开销
f(x,y)= { B(i,j)|i=1,2,…,N; j=1,2,…,N; N≥ 8 }
对于 JPEG标准,取 N= 8,即 MCU = 8× 8,形成 64个变换点例:一幅实际图像的分辨率为 256× 256,
可分割成 16个 8× 8采样块,需 16次 DCT系数计算
② 子块层平移:把采样数据从无符号整数转换为带正负号的整数 ( 2的补码表示 ),其值域映射为:
[0,2p-1]→[ -2p-1,2p-1-1]
若采样精度 p=8,层平移通过减 128( 27) 来完成;
p=12,则减 2048( 211)
③ FDCT变换:二维数据块的表示空间从时域变换到频域,即
f(x,y)→ F(u,v) = [Fi,j]N× N
对于每个数据块,N= 8,得到 64个 DCT系数,
即频域上 64个正交基信号的幅值;包括一个 DC系数 F(0,0),63个 AC系数 F(0,1)~ F(7,7),
此即 FDCT的输出数据
(2)量化处理量化作用:对 64个频域系数,增加高频分量的零值,
减少低频分量非零数据的幅值及其表示范围;
达到明显的数据压缩效果
① 量化器选择,采用量化间隔等长的线性量化器,其输出为
C(u,v)= Integer Round[ F(u,v)/ Q(u,v)]
其中,F(u,v)为量化器输入,Q(u,v)为量化器步长,
Integer Round为四舍五入取整处理,解码时,逆量化为
F(u,v)= C(u,v)× Q(u,v)
② 量化表生成:变换块长 N=8的量化表可由 8× 8个元素组成;
每个元素的取值范围为 [1,2N-1],即为 1~ 255的任意整数量化表的元素取值就是量化器步长,
它与 F(u,v)坐标值的分布位置有关对于 YUV彩色空间,根据亮度 Y和色差 UV分量的频域分布,
可形成两张量化表,即亮度量化表和色度量化表
JPEG编码方案推荐的两种量化表如表 4.4和表 4.5所示
⑶ 编码预处理
① Z形扫描,对 8× 8系数矩阵 [Fij],
从左上方的 AC01单元开始,
沿,Z”型对角线行程进行遍历扫描,
直至 AC77位置结束
Z形扫描处理的作用:
a.把二维数据转换为一维数值序列;并使 DC与 AC系数分离
b.把交流分量 AC大致从低频到高频进行重组,
使相同/相近幅值尽可能靠近,
且增加扫描行程中连续 0的个数;以利提高行程编码效率
② 差分编码:针对直流分量 DC进行差分值预测编码对于一幅源图像,可用前序分量 DCi-1来预测当前分量 DCi,
形成直流差分值
DIFF = DCi - DCi-1
不断做差分,则得到一个直流差分序列 — DC系数的差值集合
DIFF= { DCi- DCi-1 } i= 1,2,…,N; N≦K,K为子块个数为提高下一步熵编码的效率,应对差分值分组,并赋予组号:
第 i组,含 2i个元素; 2i-1个为正,另 2i-1为负并由附加的 i个 bit位来标识,
附加位限制在四位二进制位 ( 24),最大值为 15;
故对应的的组号 i为 0~ 15
DC差分值的编码结构见后图
③ 行程编码:经 Z型扫描后的交流分量 AC含有很多连续 0值,
因而特别适合于行程编码,且编码顺序可按扫描行程展开处理过程为:
a.识别 0行程 ( 连续 0的个数 ),并赋予块结束符 EOB
b.对非 0值序列进行分组,并附以组号 i( 1~ 15) ;
使其紧跟在 0值序列之后
AC系数的行程码结构见下图
⑷ 信息熵编码
① 中间编码格式定义,AC系数编码格式定义为两符号参数结构
ACCF = 符号 1( 行程,尺寸 )
符号 2( 幅值 )
行程参数的取值范围为 1~ 15;尺寸参数取值范围为 1~ 10;
幅值的值域为 [-210,210-1]
DC系数编码格式 ( DCCF) 与 ACCF保持一致,定义为:
DCCF = 符号 1( 尺寸 )
符号 2( 幅值 )
其中:尺寸 ( 代码位长 ) 以 1~ 11bit表示;
幅值的值域为 [-211,211-1]
各符号参数的含义和码字结构见上图
② 可变长熵编码:针对符号对 ( 符号 1,符号 2) 序列进行变长编码 ( VLC)
a.对 DC和 AC的符号 1序列,可用 Huffman变长码表进行编码
b.对于符号 2序列,采用变长整数 ( VLI) 码表进行编码
3.4.2 MPEG编码标准
MPEG标准:采用不对称算法:编码 — 非实时,解码 — 实时
1.MPEG系统的参考框架
MPEG混合编码的基本组合模式:
运动补偿帧间预测编码 + ADCT帧内编码 + 音频编码其中,帧内编码部分实际上就是 JPEG编码框架视频混合编码原理,是 A/ V组合模式的核心部分,实现过程:
① 采用基于运动补偿的帧间预测编码,
以减少时间冗余,提高压缩速度和压缩比
② 采用基于宏块的 DCT变换编码,
以减少空间冗余,大幅度提高压缩比
③ 对 DCT系数进行量化处理及误差优化处理,
进一步提高压缩比并降低存储开销
④ 对每个宏块的量化系数进行变长熵编码,
最终改善算法的保真度性能
2,MPEG-1的混合编码过程
⑴ 基于运动补偿的帧间预测过程
① 运动图像分组:含 IPB三类编码对象,供差分编码或插补
② 运动序列组成:合理设置 IPB之间的交插关系,形成位流
③ 宏块运动表示:基于宏块 ( 6个 8× 8块 ) 的运动表示为:
·帧内宏块 I用 JPEG算法处理
·前向/后向/双向宏块 ( F,B,A) 用帧间预测处理
④ 运动估值和补偿:根据所用宏块类型,
选择合适的宏块预测模型,进行运动估值计算
B图像宜用插补法,即用匹配块替代被预测块
P图像宜用 ADCT,即对预测误差进行编码,
用匹配块加上预测误差进行运动补偿
⑵ 基于 ADCT的帧内编码过程
① FDCT变换:按宏块标定的块数据流次序 ( 6个 8× 8块 )
进行变换处理
② 量化处理:帧内块 ( I块 ) 含 DCT系数的主部信息,
量化步长宜短些,以加大量化精度预测块 ( F,B,A) 的差分值含边缘信息和运动矢量信息,
量化步长可长些,以节省存储开销
③ 编码预处理,Z形扫描及系数分离/重定序;
DC差分编码;
AC行程编码
④ 变长熵编码:宏块表示的中性数据格式转换,
Huffman/变长整数编码
3,MPEG-2混合编码说明
① 编码过程和计算方法与 MPEG-1基本相同
② MPEG-2提供隔行扫描制式和可选编码方式,包括
·帧内扫描
( 把一个 16× 16亮度宏块分解为 4个 8× 8单块,
扫描不交叉 )
·场内扫描 ( 对 4个 8× 8单块,扫描交叉进行 )
③ 采用具有基础层和扩散层结构特征的分层编码
3.4.3 H.261编码标准
H.261标准:用于规定可视电话和电视会议的视频编码算法;
具有信源与信道综合编码功能
1.视频编码格式
⑴ 公用交换格式 CIF,当信道带宽 SB> 128kbps时,
可传送亮度分辨率为 352× 288的全屏幕格式图像
CIF格式的最低速率应为 320kbps( p= 5) ;
若要支持电视会议应用,应选 p≧ 6
CIF格式为 NTSC,PAL和 SECAM等彩电制式信号提供了相互兼容的信息交换环境,
是一种广播视频数据格式转换的集成机制,
适用于世界范围的多媒体网络通信
CIF作用原理可表示为:
⑵ QCIF格式 ( Quarter CIF)
定义:当信道带宽 SB≦ 128kbps时,
可传送分辨率为 176× 144的四分之一屏幕格式图像;
这种模式称 QCIF
适用:可视电话 ( P= 1~ 2)
⑶ 扩展的图像操作格式
·Sub-QCIF(88× 72)
·QCIF(176× 144)
·CIF(352× 288)
·4CIF(704× 576)
·16CIF(1408× 1152)
2.H.261混合编码过程视频编码结构:主要由 5部分组成,包括源信号预处理,信源编码,多重化即多路复合操作,
数据流缓存控制,编码控制编码过程: