无线通信工程姚彦教授清华大学微波与数字通信国家重点实验室
2001年 11月 24日第六讲无线通信的信源编码引言
信源的原始信号绝大多数是模拟信号,因此,信源编码的第一个任务是模拟和数字的变换,即,A/D,D/A。
抽样率取决于原始信号的带宽:
fc = 2? w,w为信号带宽
抽样点的比特数取决于 经编译码后的信号质量要求:
SNR = 6? L(dB),L为量化位数概述
但是,由于传输信道带宽的限制,又由于原始信源的信号具有很强的相关性,则信源编码不是简单的 A/D,D/A,而是要进行压缩 。 为通信传输而进行信源编码,主要就是压缩编码 。
信源编码要考虑的因素:
-发信源的统计特性 。
-传输信道引入的损伤,如误码 。
- 受信者的质量要求 。
概述(续)
信源编码定理:
对于给定的失真率 D,总可以找到一种信源编码方法,只要信源速率 R大于 R(D),就可以在平均失真任意接近 D的条件下实现波形重建 。
说明 1,R(D)称为率失真函数,它是单调非增函数,速率越高,平均失真越小 。
说明 2:为了保证在一定速率下的失真,必需采用信源编码,因而会引入编码延时 。
理论
信道编码定理:
如果信源速率 R小于信道容量 C,总可以找到一种信道编码方法,使得信源信息可以在有噪声信道上进行无差错传输,即:
R? C,无差错传输条件
说明 1:信道容量 C是根据仙侬定理得到 的
C = W?log2(1+S/N)
说明 2:为了保证无差错传输,必需采用信道编码,因而会引入编码延时 。
理论(续)
信息传输定理:
将信源编码定理和信道编码定理综合,就得到信息传输定理 。 即:为保证无差错传输及失真度,必需满足,C? R(D)
说明 1,在一般数字通信系统中,信源编码和信道编码可以分开考虑 。 信道编码定理给出无差错的速率上限,信源编码定理给出无失真的速率下限 。
说明 2:为了实现理想性能,都要付出延时的代价 。
理论(续)
速率:高速率,中速率,低速率压缩比
质量:客观评价主观评价
延时:质量和延时的关系不同业务对延时的要求
复杂性:算法的复杂性及软硬件实现的复杂性性能指标
波形编码将波形直接变换成数字码流 。 特点:比特率较高,解码后质量较高,延时较小 。 可以分为:时域波形编码,如 PCM、
ADPCM,?M等;频域波形编码,如:子带编码 ( SBC),
自适应变换编码 ( ATC) 等 。
参数编码从信源信号的某个域中提取特征参数,并变换成数字码流 。
特点:比特率较低,解码后质量较低,延时较大 。 如:各种声码器 。
混合编码将以上二种方法混合,特点:以较低的比特率获得较高的质量,延时适中,复杂 。 如,G723.1,G728,G729,GSM的语音编码,IS-95的语音编码等 。
实现方法音频编码
提高传输的质量
便于处理
使用灵活,便于多种媒体 ( 视频,音频,文字,
数据 ) 相结合应用
易于加密
适合大规模集成
可靠性高,体积功耗小
价格便宜音频编码的优点分类 频率范围
Hz
动态范围 采样频率
k Hz
质量要求主要应用电话语音 3 0 0 - 3 4 0 0 4 8 d B 8 清晰度 数字电话宽带语音 5 0 - 7 0 0 0 8 4 d B 16 清晰度 扬声器电话
I SD N 会议电视广播音频 1 0 - 2 0 k 9 6 d B 48
4 4,1
32
保真度 音频产品节目分配和交换数字声广播数字声存储视频会议多媒体系统高质量电视音频编码的应用压缩的必要性类型带宽
KHZ
采样率
KHZ
比特 / 样点比特率
k b/ s
电话语音 0,3 ~ 3,4 8 12 96
宽带语音 0,0 5 ~ 7 16 14 2 2 4
调频广播 0,0 2 ~ 1 5 32 16 5 1 2
CD 光盘 0,0 1 ~ 2 0 4 4,1 16 7 0 5,6
D A B/ D A T 0,0 1 ~ 2 0 48 16 7 6 8
波形编码
PCM原理 ( 37年,法 Alec Reeres)
电子管 PCM( 46年,Bell实验室 )
晶体管 PCM( 62年,市话扩容,64kb/s)
单片 IC PCM( 70年代,微波,卫星,光纤 )
增量编码原理 ( 46年,法 De Loraine)
自适应增量 CVSD( 60年代末,军用,32,16kb/s)
Continuously Variable Slope Delta Modulator
连续变化斜率增量调制器
其他编码 ( 70年代,ADPCM,SubBand,ATC,APC等 )
在 16kb/s以上得到较好的话音质量 。
特点:话音质量好,但编码速率高 。
音频编码历史:数字电话( 1)
参数编码
波形编码通道声码器 ( 39年,Dudly,二次大战保密电话 )
LPC声码器 ( 67年,Atal,Schroeder)
同态声码器 ( 69年,Oppenheim)
共振峰声码器 ( 71年,Rabiner,Schafer,Elanagan)
MBE声码器 ( 88年,Griffin,Lim)
波形插值 ( 91年,W.B,Kleijn)
2.4kb/s,1.2kb/s,较好; 600-800b/s可懂 。 特点:编码速率低,自然度差 。
混合编码器利用线性预测,VQ,A-B-S,感觉加权,后滤波等技术 。
多脉冲激励线性预测 ( MPELP 1982 Atal,Remde)
规则脉冲激励线性预测 ( RPELP 1985 Deprettere,Kroon)
码本激励线性预测 ( CELP 1985 Manfred,Schroeder,Atal)
8-16kb/s,高质量 。 特点:话音质量高,编码速率低,但算法复杂 。
音频编码历史:数字电话( 2)
主要应用于会议电视,相当于调幅广播的质量
1988年 CCITT制定了 G.722 标准,SB-ADPCM
1996 年左右,美国 PictureTel 公 司 提 出 PTC -
PictureTel Transform Coder
1999 年 9 月发布:,ITU-T G.722.1 proposed for
decision,7 kHz Audio - Coding At 24 And 32kbit/s
For Hands Free Operation In Systems With Low Frame
Loss。,
音频编码历史:宽带语音主要应用于娱乐与鉴赏,对于重建信号的音质有很高的要求,目前采用比特率较高的波形编码技术进行压缩 。 可以直接在时域进行,也可以转到频域或其他变换域进行 。
1982年激光唱盘 (CD,Compact Disk)上市 。 MD,Mini-
Disk,日本索尼公 司采用 ATRAC- Adaptive Transform
Acoustic Coder压缩技术 。
1987数字音频磁带录音 (DAT,Digital Audio Tape) 问世 。
DAB (Digital Audio Broadcasting) 源于欧洲 。
音频编码历史:宽带音频音频压缩依据
1) 冗余度
时域样点之间相关 ( 短时,长时 )
频域谱的非平坦性 ( 谱包络,谱离散 )
统计特性
2) 人耳听觉特性
人耳分辨能力
人耳对不同频段声音的敏感程度不同,通常对低频比对高频更敏感
人耳对语音信号的相位不敏感
人耳掩蔽效应 Masking Effect …
说明:对人耳听不到或感知极不灵敏的声音分量都不妨视为冗余 。
可利用听觉心理特性 … 。
感觉加权,量化,去除多余分量,后滤波,… 。
音频编码性能评价( 1)
1) 编码速率 ( Kbps,Kb/s)
信号带宽:可懂度,自然度,透明度 。
200~3400Hz,50~7000Hz,20~15000Hz,10~20000HZ。
采样速率,8KHz,16KHz,32KHz,44.1/48KHz… 。
编码位数 R( b/样点 ),总速率 I( kb/s) 。
固定速率及可变速率 。
2) 重建语音质量
客观评价:
信噪比
分段信噪比
( 一般 15dB以上较好,20dB以上相当好 )
音频编码性能评价( 2)
主观评价
MOS分( Mean Opinion Score)
5~1分,Excellent,Good,Fair,Poor,Bad
4分:长途通信质量 (toll,transparency-电话线 )
3.5分:通信质量 (communication)
判断韵律测试 DRT( Diagnostic Rhyme Test)
例如:为( wei)、费( fei)
95%以上 优秀,85%~94% 良好,75%~84% 中等
65%~74% 差,65% 以下不能接受
判断可接受度测试 DAT( Diagnostic Acceptability Test)
多维因素测试
调制噪声参考单位 MNRU( Modulated Noise Reference Unit)
量化失真单位 QDU( Quantization Distortion Unit) 一次 PCM编解码音频编码性能评价( 3)
3) 编解码延时( ms)
公众网( 25ms)、点对点、广播、存储
回声控制或回声抵消
正常通话秩序
与重建质量关系
4) 算法复杂度
硬件、成本
浮点、定点
MIPS,RAM,ROM
5) 其他
抗随机误码和突发误码能力
抗丢包和丢帧能力
对不同信号编码能力
级联或转接能力现有标准( 1):宽带音频
宽带音频
ISO / M P EG I ( 1 9 9 1 )
名称 采样频率 K HZ 编码速率 K B / S 编码方式 M OS 分
La y er 1 48 1 8 0 + 1 2 SB -D BA 4,7
La y er 2 48 1 2 0 + 8 SB -D BA 4,6
l a y er 3 48 6 0 +4 SB -D BA -M D C T 3,7
SB,Su b-B a nd
D BA,D y nam i c Bi t A l l o c a t i o n
ISO / M P EG 2 ( 1993 ):将采样率扩充到 16,2 2,0 5,2 4 K HZ,带宽分别为 7,5,1 0,3,1 1,2 5 K H z 。
现有标准( 2):宽带语音
宽带语音名称 采样频率 K HZ 编码速率 K B / S 编码方式 年代 MOS 分
G.7 22 16 64,56,48 SB-ADP CM 1 98 8 4,1 4,0 3,7
G.7 22,1 16 24,32 ML T 19 99
MLT,M o du l a ted L apped T r a n s f o rm
总的算法延时为 40 m s
现有标准( 3):数字电话
语音编码标准名称采样率
KHz
编码速率
KB/S
编码制式 年代 M OS D R T 备注
G.71 1 8 64 P C M 72 4,3 95
G.726 8 1 6 ~40 A D P C M 8 4 - 8 8 4,1 94 3 2 K B/S
G.728 8 16 LD -CE LP 92 4,1 94
G.729 8 8 C S-AC ELP 95 4,1
G.723 8 5,3 A C ELP 95 3,8
G.723 8 6,3 M P -ML Q 95 4,0
G.722 16 4 8 ~64 SB-A D P C M 88 3,7~ 4,1
U S1 0 1 5 8 2,4 LP C -1 0 82 2,5 90
替 1015 8 2,4 M ELP 97 优于 D OD 1 0 1 6
U S1 0 1 6 8 4,8 C ELP 89 3,0 94
GSM 8 13 R P E-L T 88 3,7
I S- 5 4 8 8 V SELP 89 3,7
J D C 8 6,7 V SELP 90 3,5
I N M A R
SA T
8 4,1 5 I M BE 91 3,4
I S- 9 5 8 1 ~ 8 QC ELP 95 ~3,7 93 8 KB/ S
I S- 1 2 7 - 1 8 1,2,4,8,
9,6
EV R C 98
现有标准( 4):数字电话(续)
PCM,脉冲编码调制
ADPCM,自适应差分脉冲编码调制
LD-CELP,低延时码本激励线性预测编码
CS-ACELP:共轭结构代数码本激励线性预测编码
ACELP:代数码本激励线性预测编码
MP-MLQ,多脉冲激励最大似然量化
SB-ADPCM,子带自适应差分脉冲编码调制
LPC-10:线性预测编码 -10
MELP,混合激励线性预测编码
CELP,码本激励线性预测编码
RPE-LT:长时间预测规则脉冲激励线性预测编码
VSELP,矢量和激励线性预测编码
IMBE,Inmarsat多带激励语音编码
QCELP,Qualcomm码本激励线性预测编码
EVRC,增强型变速率编码无线通信的语音编码( 1)
军用无线通信
- 16 kbps CVSD增量调制
- 4.8 kbps美国军用电台标准无线通信的语音编码( 2)
无绳电话
-用于 CT-2的 ADPCM,32kbps
- 用于 DECT的 ADPCM,32kbps
无线通信的语音编码( 3)
移动通信
-用于 GSM的 REP-LTP(长时间预测规则码激励)
13kbps
-用于 IS-54的 VSELP( 矢量和激励线性预测)
8kbps
-用于 IS-95的 QCELP( Qualcomm码本激励线性预测)
1.2/9.6kbps
视频编码压缩的必要性
V I D EO
类型 格式 分辨率 帧频 HZ 比特 / 像素比特率
M b/ s
电视电话 QC I F 1 7 6 * 1 4 4 2 9,9 7 12 9,1
会议电视 C I F 3 5 2 * 2 8 8 2 9,9 7 12 3 6,4
常规电视 I TU -R 6 0 1 7 2 0 * 5 7 6 25 16 1 6 5,9
增强电视 ED TV 9 6 0 * 5 7 6 25 16 2 2 1,2
HD TV I TU -R 7 0 9 1 9 2 0 * 1 1 5 2 25 16 8 8 4,7
图象编码的历史( 1)
经典图像编码
电视信号数字化 ( P CM ) 提出 ( 19 48 年 B,M,O l i v er)
预测法、亚取样 / 内插复原、视觉特性 (5 0~ 60 年代 )
首届图像编码会议 ( P CS,19 6 9 美国 )
条件帧间修补 ( CF R,1 96 9 年 M ou nt s 等 )
运动补偿预测 ( MC,70 年代 H a k ell,80 年代 H,G,Mus m a nn 等 )
正交变换图像编码 ( DF T,WH T 等,1968 ~ H,C,A ndr e w s 等 )
D CT(19 7 4 年 N,A hm ed 等,接近 K L T)
混合编码 ( 19 7 4 年 A,H a b i bi )
子带编码 ( 19 8 5 年 S,D,O’Ne i l )
H.1 20 会议电视系统 ( 84 ~88 年 )
H.2 61,JP EG ( 8 8~9 0 年 ),H,26 3,H,26 3+ ( 95 ~ 9 7 )
MP EG - 1 (92 ),M P EG -2 ( 94 ),MP E G-4 ( 9 X),MP E G-7 ( 9 X),
MP EG - 21 ( 9 X)
图象编码的历史( 2)
现代图像编码
小波变换图像编码
神经网络图像编码
分型图像编码
模型基图像编码图象编码的依据
1,冗余度同画面样点之间相关 (同行样点、不同行样点-空域相关)
不同画面样点之间相关 (时域相关)
变换域谱的非平坦性 (频域相关)
统计分布非平坦 (统计相关)
(去除可恢复)
2,人眼视觉特性空间分辨能力 (亚取样)
时间分辨能力 (帧率)
幅度分辨能力 (量化)
亮度色度感知特性 (色度亚取样)
空间-幅度度感知特性 (平坦区、边缘区)
空间-时间感知特性 (静止画面、运动画面)
幅度-时间感知特性 (静止物体、运动物体)
(不可恢复)
图象编码的质量评价( 1)
1,编码速率分辨率、帧率、压缩倍数
2,重建图像质量
客观评价
(,) (,) (,)m n x m n y m n
1
0
1
0
22
),(
1
M
m
N
n
nmx
NM
2
1
0
1
0
2
),(
1
nm
NM
M
m
N
n
S N R?
2
2
SNR
db
10
2
2
l g ( )
P S N R
x
db
10
2
2
l g ( )
m a x
P S N R
db
10
255
48 13 10
2
2
2
l g ( ),lg
图象编码的质量评价( 2)
主观评价
MOS 分 ( Mean Opinio n Scor e )
1 ~ 5 分,Exce llent,Go od,Fai r,Poor,Bad
5 分:不能察觉
4 分:刚能察觉
3 分:明显察觉,略讨厌
2 分:明显察觉,讨厌
1 分:不能用图象编码的质量评价( 3)
3,编解码延时 ( ms )
与重建质量关系
4,算法复杂度硬件、成本
M IP S,RAM,R O M
5,其他抗随机误码和突发误码能力抗丢包和丢帧能力对不同信号编码能力
2001年 11月 24日第六讲无线通信的信源编码引言
信源的原始信号绝大多数是模拟信号,因此,信源编码的第一个任务是模拟和数字的变换,即,A/D,D/A。
抽样率取决于原始信号的带宽:
fc = 2? w,w为信号带宽
抽样点的比特数取决于 经编译码后的信号质量要求:
SNR = 6? L(dB),L为量化位数概述
但是,由于传输信道带宽的限制,又由于原始信源的信号具有很强的相关性,则信源编码不是简单的 A/D,D/A,而是要进行压缩 。 为通信传输而进行信源编码,主要就是压缩编码 。
信源编码要考虑的因素:
-发信源的统计特性 。
-传输信道引入的损伤,如误码 。
- 受信者的质量要求 。
概述(续)
信源编码定理:
对于给定的失真率 D,总可以找到一种信源编码方法,只要信源速率 R大于 R(D),就可以在平均失真任意接近 D的条件下实现波形重建 。
说明 1,R(D)称为率失真函数,它是单调非增函数,速率越高,平均失真越小 。
说明 2:为了保证在一定速率下的失真,必需采用信源编码,因而会引入编码延时 。
理论
信道编码定理:
如果信源速率 R小于信道容量 C,总可以找到一种信道编码方法,使得信源信息可以在有噪声信道上进行无差错传输,即:
R? C,无差错传输条件
说明 1:信道容量 C是根据仙侬定理得到 的
C = W?log2(1+S/N)
说明 2:为了保证无差错传输,必需采用信道编码,因而会引入编码延时 。
理论(续)
信息传输定理:
将信源编码定理和信道编码定理综合,就得到信息传输定理 。 即:为保证无差错传输及失真度,必需满足,C? R(D)
说明 1,在一般数字通信系统中,信源编码和信道编码可以分开考虑 。 信道编码定理给出无差错的速率上限,信源编码定理给出无失真的速率下限 。
说明 2:为了实现理想性能,都要付出延时的代价 。
理论(续)
速率:高速率,中速率,低速率压缩比
质量:客观评价主观评价
延时:质量和延时的关系不同业务对延时的要求
复杂性:算法的复杂性及软硬件实现的复杂性性能指标
波形编码将波形直接变换成数字码流 。 特点:比特率较高,解码后质量较高,延时较小 。 可以分为:时域波形编码,如 PCM、
ADPCM,?M等;频域波形编码,如:子带编码 ( SBC),
自适应变换编码 ( ATC) 等 。
参数编码从信源信号的某个域中提取特征参数,并变换成数字码流 。
特点:比特率较低,解码后质量较低,延时较大 。 如:各种声码器 。
混合编码将以上二种方法混合,特点:以较低的比特率获得较高的质量,延时适中,复杂 。 如,G723.1,G728,G729,GSM的语音编码,IS-95的语音编码等 。
实现方法音频编码
提高传输的质量
便于处理
使用灵活,便于多种媒体 ( 视频,音频,文字,
数据 ) 相结合应用
易于加密
适合大规模集成
可靠性高,体积功耗小
价格便宜音频编码的优点分类 频率范围
Hz
动态范围 采样频率
k Hz
质量要求主要应用电话语音 3 0 0 - 3 4 0 0 4 8 d B 8 清晰度 数字电话宽带语音 5 0 - 7 0 0 0 8 4 d B 16 清晰度 扬声器电话
I SD N 会议电视广播音频 1 0 - 2 0 k 9 6 d B 48
4 4,1
32
保真度 音频产品节目分配和交换数字声广播数字声存储视频会议多媒体系统高质量电视音频编码的应用压缩的必要性类型带宽
KHZ
采样率
KHZ
比特 / 样点比特率
k b/ s
电话语音 0,3 ~ 3,4 8 12 96
宽带语音 0,0 5 ~ 7 16 14 2 2 4
调频广播 0,0 2 ~ 1 5 32 16 5 1 2
CD 光盘 0,0 1 ~ 2 0 4 4,1 16 7 0 5,6
D A B/ D A T 0,0 1 ~ 2 0 48 16 7 6 8
波形编码
PCM原理 ( 37年,法 Alec Reeres)
电子管 PCM( 46年,Bell实验室 )
晶体管 PCM( 62年,市话扩容,64kb/s)
单片 IC PCM( 70年代,微波,卫星,光纤 )
增量编码原理 ( 46年,法 De Loraine)
自适应增量 CVSD( 60年代末,军用,32,16kb/s)
Continuously Variable Slope Delta Modulator
连续变化斜率增量调制器
其他编码 ( 70年代,ADPCM,SubBand,ATC,APC等 )
在 16kb/s以上得到较好的话音质量 。
特点:话音质量好,但编码速率高 。
音频编码历史:数字电话( 1)
参数编码
波形编码通道声码器 ( 39年,Dudly,二次大战保密电话 )
LPC声码器 ( 67年,Atal,Schroeder)
同态声码器 ( 69年,Oppenheim)
共振峰声码器 ( 71年,Rabiner,Schafer,Elanagan)
MBE声码器 ( 88年,Griffin,Lim)
波形插值 ( 91年,W.B,Kleijn)
2.4kb/s,1.2kb/s,较好; 600-800b/s可懂 。 特点:编码速率低,自然度差 。
混合编码器利用线性预测,VQ,A-B-S,感觉加权,后滤波等技术 。
多脉冲激励线性预测 ( MPELP 1982 Atal,Remde)
规则脉冲激励线性预测 ( RPELP 1985 Deprettere,Kroon)
码本激励线性预测 ( CELP 1985 Manfred,Schroeder,Atal)
8-16kb/s,高质量 。 特点:话音质量高,编码速率低,但算法复杂 。
音频编码历史:数字电话( 2)
主要应用于会议电视,相当于调幅广播的质量
1988年 CCITT制定了 G.722 标准,SB-ADPCM
1996 年左右,美国 PictureTel 公 司 提 出 PTC -
PictureTel Transform Coder
1999 年 9 月发布:,ITU-T G.722.1 proposed for
decision,7 kHz Audio - Coding At 24 And 32kbit/s
For Hands Free Operation In Systems With Low Frame
Loss。,
音频编码历史:宽带语音主要应用于娱乐与鉴赏,对于重建信号的音质有很高的要求,目前采用比特率较高的波形编码技术进行压缩 。 可以直接在时域进行,也可以转到频域或其他变换域进行 。
1982年激光唱盘 (CD,Compact Disk)上市 。 MD,Mini-
Disk,日本索尼公 司采用 ATRAC- Adaptive Transform
Acoustic Coder压缩技术 。
1987数字音频磁带录音 (DAT,Digital Audio Tape) 问世 。
DAB (Digital Audio Broadcasting) 源于欧洲 。
音频编码历史:宽带音频音频压缩依据
1) 冗余度
时域样点之间相关 ( 短时,长时 )
频域谱的非平坦性 ( 谱包络,谱离散 )
统计特性
2) 人耳听觉特性
人耳分辨能力
人耳对不同频段声音的敏感程度不同,通常对低频比对高频更敏感
人耳对语音信号的相位不敏感
人耳掩蔽效应 Masking Effect …
说明:对人耳听不到或感知极不灵敏的声音分量都不妨视为冗余 。
可利用听觉心理特性 … 。
感觉加权,量化,去除多余分量,后滤波,… 。
音频编码性能评价( 1)
1) 编码速率 ( Kbps,Kb/s)
信号带宽:可懂度,自然度,透明度 。
200~3400Hz,50~7000Hz,20~15000Hz,10~20000HZ。
采样速率,8KHz,16KHz,32KHz,44.1/48KHz… 。
编码位数 R( b/样点 ),总速率 I( kb/s) 。
固定速率及可变速率 。
2) 重建语音质量
客观评价:
信噪比
分段信噪比
( 一般 15dB以上较好,20dB以上相当好 )
音频编码性能评价( 2)
主观评价
MOS分( Mean Opinion Score)
5~1分,Excellent,Good,Fair,Poor,Bad
4分:长途通信质量 (toll,transparency-电话线 )
3.5分:通信质量 (communication)
判断韵律测试 DRT( Diagnostic Rhyme Test)
例如:为( wei)、费( fei)
95%以上 优秀,85%~94% 良好,75%~84% 中等
65%~74% 差,65% 以下不能接受
判断可接受度测试 DAT( Diagnostic Acceptability Test)
多维因素测试
调制噪声参考单位 MNRU( Modulated Noise Reference Unit)
量化失真单位 QDU( Quantization Distortion Unit) 一次 PCM编解码音频编码性能评价( 3)
3) 编解码延时( ms)
公众网( 25ms)、点对点、广播、存储
回声控制或回声抵消
正常通话秩序
与重建质量关系
4) 算法复杂度
硬件、成本
浮点、定点
MIPS,RAM,ROM
5) 其他
抗随机误码和突发误码能力
抗丢包和丢帧能力
对不同信号编码能力
级联或转接能力现有标准( 1):宽带音频
宽带音频
ISO / M P EG I ( 1 9 9 1 )
名称 采样频率 K HZ 编码速率 K B / S 编码方式 M OS 分
La y er 1 48 1 8 0 + 1 2 SB -D BA 4,7
La y er 2 48 1 2 0 + 8 SB -D BA 4,6
l a y er 3 48 6 0 +4 SB -D BA -M D C T 3,7
SB,Su b-B a nd
D BA,D y nam i c Bi t A l l o c a t i o n
ISO / M P EG 2 ( 1993 ):将采样率扩充到 16,2 2,0 5,2 4 K HZ,带宽分别为 7,5,1 0,3,1 1,2 5 K H z 。
现有标准( 2):宽带语音
宽带语音名称 采样频率 K HZ 编码速率 K B / S 编码方式 年代 MOS 分
G.7 22 16 64,56,48 SB-ADP CM 1 98 8 4,1 4,0 3,7
G.7 22,1 16 24,32 ML T 19 99
MLT,M o du l a ted L apped T r a n s f o rm
总的算法延时为 40 m s
现有标准( 3):数字电话
语音编码标准名称采样率
KHz
编码速率
KB/S
编码制式 年代 M OS D R T 备注
G.71 1 8 64 P C M 72 4,3 95
G.726 8 1 6 ~40 A D P C M 8 4 - 8 8 4,1 94 3 2 K B/S
G.728 8 16 LD -CE LP 92 4,1 94
G.729 8 8 C S-AC ELP 95 4,1
G.723 8 5,3 A C ELP 95 3,8
G.723 8 6,3 M P -ML Q 95 4,0
G.722 16 4 8 ~64 SB-A D P C M 88 3,7~ 4,1
U S1 0 1 5 8 2,4 LP C -1 0 82 2,5 90
替 1015 8 2,4 M ELP 97 优于 D OD 1 0 1 6
U S1 0 1 6 8 4,8 C ELP 89 3,0 94
GSM 8 13 R P E-L T 88 3,7
I S- 5 4 8 8 V SELP 89 3,7
J D C 8 6,7 V SELP 90 3,5
I N M A R
SA T
8 4,1 5 I M BE 91 3,4
I S- 9 5 8 1 ~ 8 QC ELP 95 ~3,7 93 8 KB/ S
I S- 1 2 7 - 1 8 1,2,4,8,
9,6
EV R C 98
现有标准( 4):数字电话(续)
PCM,脉冲编码调制
ADPCM,自适应差分脉冲编码调制
LD-CELP,低延时码本激励线性预测编码
CS-ACELP:共轭结构代数码本激励线性预测编码
ACELP:代数码本激励线性预测编码
MP-MLQ,多脉冲激励最大似然量化
SB-ADPCM,子带自适应差分脉冲编码调制
LPC-10:线性预测编码 -10
MELP,混合激励线性预测编码
CELP,码本激励线性预测编码
RPE-LT:长时间预测规则脉冲激励线性预测编码
VSELP,矢量和激励线性预测编码
IMBE,Inmarsat多带激励语音编码
QCELP,Qualcomm码本激励线性预测编码
EVRC,增强型变速率编码无线通信的语音编码( 1)
军用无线通信
- 16 kbps CVSD增量调制
- 4.8 kbps美国军用电台标准无线通信的语音编码( 2)
无绳电话
-用于 CT-2的 ADPCM,32kbps
- 用于 DECT的 ADPCM,32kbps
无线通信的语音编码( 3)
移动通信
-用于 GSM的 REP-LTP(长时间预测规则码激励)
13kbps
-用于 IS-54的 VSELP( 矢量和激励线性预测)
8kbps
-用于 IS-95的 QCELP( Qualcomm码本激励线性预测)
1.2/9.6kbps
视频编码压缩的必要性
V I D EO
类型 格式 分辨率 帧频 HZ 比特 / 像素比特率
M b/ s
电视电话 QC I F 1 7 6 * 1 4 4 2 9,9 7 12 9,1
会议电视 C I F 3 5 2 * 2 8 8 2 9,9 7 12 3 6,4
常规电视 I TU -R 6 0 1 7 2 0 * 5 7 6 25 16 1 6 5,9
增强电视 ED TV 9 6 0 * 5 7 6 25 16 2 2 1,2
HD TV I TU -R 7 0 9 1 9 2 0 * 1 1 5 2 25 16 8 8 4,7
图象编码的历史( 1)
经典图像编码
电视信号数字化 ( P CM ) 提出 ( 19 48 年 B,M,O l i v er)
预测法、亚取样 / 内插复原、视觉特性 (5 0~ 60 年代 )
首届图像编码会议 ( P CS,19 6 9 美国 )
条件帧间修补 ( CF R,1 96 9 年 M ou nt s 等 )
运动补偿预测 ( MC,70 年代 H a k ell,80 年代 H,G,Mus m a nn 等 )
正交变换图像编码 ( DF T,WH T 等,1968 ~ H,C,A ndr e w s 等 )
D CT(19 7 4 年 N,A hm ed 等,接近 K L T)
混合编码 ( 19 7 4 年 A,H a b i bi )
子带编码 ( 19 8 5 年 S,D,O’Ne i l )
H.1 20 会议电视系统 ( 84 ~88 年 )
H.2 61,JP EG ( 8 8~9 0 年 ),H,26 3,H,26 3+ ( 95 ~ 9 7 )
MP EG - 1 (92 ),M P EG -2 ( 94 ),MP E G-4 ( 9 X),MP E G-7 ( 9 X),
MP EG - 21 ( 9 X)
图象编码的历史( 2)
现代图像编码
小波变换图像编码
神经网络图像编码
分型图像编码
模型基图像编码图象编码的依据
1,冗余度同画面样点之间相关 (同行样点、不同行样点-空域相关)
不同画面样点之间相关 (时域相关)
变换域谱的非平坦性 (频域相关)
统计分布非平坦 (统计相关)
(去除可恢复)
2,人眼视觉特性空间分辨能力 (亚取样)
时间分辨能力 (帧率)
幅度分辨能力 (量化)
亮度色度感知特性 (色度亚取样)
空间-幅度度感知特性 (平坦区、边缘区)
空间-时间感知特性 (静止画面、运动画面)
幅度-时间感知特性 (静止物体、运动物体)
(不可恢复)
图象编码的质量评价( 1)
1,编码速率分辨率、帧率、压缩倍数
2,重建图像质量
客观评价
(,) (,) (,)m n x m n y m n
1
0
1
0
22
),(
1
M
m
N
n
nmx
NM
2
1
0
1
0
2
),(
1
nm
NM
M
m
N
n
S N R?
2
2
SNR
db
10
2
2
l g ( )
P S N R
x
db
10
2
2
l g ( )
m a x
P S N R
db
10
255
48 13 10
2
2
2
l g ( ),lg
图象编码的质量评价( 2)
主观评价
MOS 分 ( Mean Opinio n Scor e )
1 ~ 5 分,Exce llent,Go od,Fai r,Poor,Bad
5 分:不能察觉
4 分:刚能察觉
3 分:明显察觉,略讨厌
2 分:明显察觉,讨厌
1 分:不能用图象编码的质量评价( 3)
3,编解码延时 ( ms )
与重建质量关系
4,算法复杂度硬件、成本
M IP S,RAM,R O M
5,其他抗随机误码和突发误码能力抗丢包和丢帧能力对不同信号编码能力