第10章 彩色数字电视基础
***************************************************************************
10.1 彩色电视制式
10.1.1 简介
10.1.2 电视扫描和同步
10.1.3 彩色电视
10.2 彩色电视信号的类型
10.2.1 复合电视信号
10.2.2 分量电视信号
10.2.3 S-Video信号
10.3 电视图像数字化
10.3.1 数字化的方法
10.3.2 数字化标准
10.4 图像子采样
10.4.1 图像子采样概要
10.4.2 4:4:4 YCbCr格式
10.4.3 4:2:2 YCbCr格式
10.4.4 4:1:1 YCbCr格式
10.4.5 4:2:0 YCbCr格式练习与思考题参考文献和站点
***************************************************************************
电视是当代最有影响力的信息传播工具!
电视是20世纪20年代的伟大发明,在50年代开发电视技术时,用任何一种数字技术来传输和再现真实世界的图像和声音都是极其困难的,因此电视技术一直沿着模拟信号处理技术的方向发展,直到70年代才开始开发数字电视。由于数字技术具有许多优越性,而且数字技术发展到足以使模拟电视向数字电视过渡的水平,电视和计算机才开始融合在一起。
彩色数字电视是从模拟电视和模拟彩色电视发展而来的,因此本章的前半部分将介绍模拟电视的一些基本常识,而后半部分将介绍彩色数字电视的基本常识。这些基本常识对理解MPEG电视是极其有用的。
10.1 彩色电视制式
10.1.1 简介目前世界上现行的彩色电视制式有三种:NTSC制、PAL制和SECAM制。这里不包括高清晰度彩色电视HDTV (High-Definition television)。数字彩色电视是从模拟彩色电视基础上发展而来的,因此在多媒体技术中经常会碰到这些术语。
NTSC(National Television Systems Committee)彩色电视制是1952年美国国家电视标准委员会定义的彩色电视广播标准,称为正交平衡调幅制。美国、加拿大等大部分西半球国家,以及日本、韩国、菲律宾等国和中国的台湾采用这种制式。
由于NTSC制存在相位敏感造成彩色失真的缺点,因此德国(当时的西德)于1962年制定了PAL(Phase-Alternative Line)制彩色电视广播标准,称为逐行倒相正交平衡调幅制。德国、英国等一些西欧国家,以及中国、朝鲜等国家采用这种制式。
法国制定了SECAM (法文:Sequential Coleur Avec Memoire)彩色电视广播标准,称为顺序传送彩色与存储制。法国、苏联及东欧国家采用这种制式。世界上约有65个地区和国家试验这种制式。
NTSC制、PAL制和SECAM制都是兼容制制式。这里说的“兼容”有两层意思:一是指黑白电视机能接收彩色电视广播,显示的是黑白图像,另一层意思是彩色电视机能接收黑白电视广播,显示的也是黑白图像,这叫逆兼容性。为了既能实现兼容性而又要有彩色特性,因此彩色电视系统应满足下列几方面的要求:
(1) 必需采用与黑白电视相同的一些基本参数,如扫描方式、扫描行频、场频、帧频、同步信号、图像载频、伴音载频等等。
(2) 需要将摄像机输出的三基色信号转换成一个亮度信号,以及代表色度的两个色差信号,并将它们组合成一个彩色全电视信号进行传送。在接收端,彩色电视机将彩色全电视信号重新转换成三个基色信号,在显象管上重现发送端的彩色图像。
10.1.2 电视扫描和同步扫描有隔行扫描(interlaced scanning)和非隔行扫描之分。非隔行扫描也称逐行扫描,图10-01表示了这两种扫描方式的差别。黑白电视和彩色电视都用隔行扫描,而计算机显示图像时一般都采用非隔行扫描。
(a) 逐行扫描
(b) 隔行扫描图10-01 图像的光栅扫描
在非隔行扫描中,电子束从显示屏的左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整的图像,如图10-01(a)所示。
在隔行扫描中,电子束扫完第1行后回到第3行开始的位置接着扫,如图10-01(b)所示,然后在第5、7、……,行上扫,直到最后一行。奇数行扫完后接着扫偶数行,这样就完成了一帧(frame)的扫描。由此可以看到,隔行扫描的一帧图像由两部分组成:一部分是由奇数行组成,称奇数场,另一部分是由偶数行组成,称为偶数场,两场合起来组成一帧。因此在隔行扫描中,无论是摄像机还是显示器,获取或显示一幅图像都要扫描两遍才能得到一幅完整的图像。
在隔行扫描中、扫描的行数必须是奇数。如前所述,一帧画面分两场,第一场扫描总行数的一半,第二场扫描总行数的另一半。隔行扫描要求第一场结束于最后一行的一半,不管电子束如何折回,它必须回到显示屏顶部的中央,这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。正是这个原因,才要求总的行数必须是奇数。
每秒钟扫描多少行称为行频fH;每秒钟扫描多少场称为场频ff;每秒扫描多少帧称帧频fF。ff和fF是两个不同的概念。
1,PAL制电视的扫描特性
PAL电视制的主要扫描特性是:
(1) 625行(扫描线)/帧,25帧/秒(40 ms/帧)
(2) 高宽比(aspect ratio):4:3
(3) 隔行扫描,2场/帧,312.5行/场
(4) 颜色模型:YUV。
一帧图像的总行数为625,分两场扫描。行扫描频率是15 625 Hz,周期为64μs;场扫描频率是50 Hz,周期为20 ms;帧频是25 Hz,是场频的一半,周期为40 ms。在发送电视信号时,每一行中传送图像的时间是52.2μs,其余的11.8μs不传送图像,是行扫描的逆程时间,同时用作行同步及消隐用。每一场的扫描行数为625/2=312.5行,其中25行作场回扫,不传送图像,传送图像的行数每场只有287.5行,因此每帧只有575行有图像显示。图10-02所示表示的是一个行周期的电视信号,彩色电视信号与它相似。
图10-02 一个行周期的电视信号(黑白电视系统)
2,NTSC制的扫描特性
NTSC彩色电视制的主要特性是:
(1) 525行/帧,30帧/秒(29.97 fps,33.37 ms/frame)
(2) 高宽比:电视画面的长宽比(电视为4:3;电影为3:2;高清晰度电视为16:9)
(3) 隔行扫描,一帧分成2场(field),262.5线/场
(4) 在每场的开始部分保留20扫描线作为控制信息,因此只有485条线的可视数据。Laser disc约~420线,S-VHS约~320线
(5) 每行63.5微秒,水平回扫时间10微秒(包含5微秒的水平同步脉冲),所以显示时间是53.5微秒。
(6) 颜色模型:YIQ
一帧图像的总行数为525行,分两场扫描。行扫描频率为15 750 Hz,周期为63.5μs;场扫描频率是60 Hz,周期为16.67 ms;帧频是30 Hz,周期33.33 ms。每一场的扫描行数为525/2=262.5行。除了两场的场回扫外,实际传送图像的行数为480行。
3,SECAM
SECAM (法文:Sequential Coleur Avec Memoire)制式是法国开发的一种彩色电视广播标准,称为顺序传送彩色与存储制。这种制式与PAL制类似,其差别是SECAM中的色度信号是频率调制(FM),而且它的两个色差信号:红色差(R'-Y')和蓝色差(B'-Y')信号是按行的顺序传输的。法国、俄罗斯、东欧和中东等约有65个地区和国家使用这种制式,图像格式为4:3,625线,50 Hz,6 MHz电视信号带宽,总带宽8 MHz。
以上三种电视制式的主要特性如表10-01和表10-02所示。
表10-01 彩色电视的同步信号
TV制式
PAL
NTSC
SECAM
行周期(H)
64.0
63.55
64.0
水
消隐宽度
11.8
10.8
11.8
平
同步宽度
4.7
4.7
4.7
定
前肩
1.3
1.3
1.3
时
色同步起点
5.6
5.1
—
(μs)
色同步宽度
2.25
2.67
—
均衡脉冲宽度
2.35
2.3
2.35
场同步脉冲宽度
27.3
27.1
27.3
垂直
消隐宽度
25H
20H
25H
(场)
均衡脉冲数
5
6
5
同步
场同步脉冲数
5
6
5
表10-02 彩色电视国际标准
TV制式
PAL
G I D
NTSC
M
SECAM
行/帧
625
525
625
帧/秒(场/秒)
25(50)
30(60)
25(50)
行/秒
15625
15734
15625
参考白光
C白
D6500
D6500
声音载频(MHz)
5.5 6.0 6.5
4.5
6.5
γ
2.8
2.2
2.8
彩色副载频(Hz)
4433618
3579545
4250000(+U)
4406500(-V)
彩色调制
QAM
QAM
FM
亮度带宽(MHz)
5.0 5.5
4.2
6.0
色度带宽(MHz)
1.3(Ut)
1.3(Vt)
1.3(I) 0.6(Q)
>1.0(Ut)
>1.0(Vt)
10.1.3 彩色电视彩色电视是在黑白电视基础上发展起来的。彩色电视的许多特性,如扫描、同步等都与黑白电视相同,不同的是显示的图像的颜色不同。
根据三基色的基本原理,任何一种颜色都可以用R、G、B三个彩色分量按一定的比例混合得到,但要精确地复显自然景物中的彩色确是相当困难的。值得庆幸的是,科学家们对人的彩色视觉特性经过长期研究后发现,在重显自然景物彩色过程中,并不一定要恢复原景物辐射的所有光波成分,而重要的是获得与原景物相同的彩色感觉。
图10-03说明用彩色摄像机摄取景物时,如何把自然景物的彩色分解为R、G、B分量,以及如何重显自然景物彩色的过程。
图10-03 彩色图像重现过程
按照色度学的基本原理,用R、G、B三基色的各种线性组合可以构造出各种不同的彩色空间来表示景物的颜色。各种不同的彩色空间在不同的应用中也许会比原始的RGB彩色空间具有更有用的特性,更有效且更经济。因此在彩色电视中,用Y、C1,C2彩色表示法分别表示亮度信号和两个色差信号,C1,C2的含义与具体的应用有关。在NTSC彩色电视制中,C1,C2分别表示I、Q两个色差信号;在PAL彩色电视制中,C1,C2分别表示U、V两个色差信号;在CCIR 601数字电视标准中,C1,C2分别表示Cr,Cb两个色差信号。所谓色差是指基色信号中的三个分量信号(即R、G、B)与亮度信号之差。
在彩色电视中,使用Y、C1,C2有两个重要优点:①Y和C1,C2是独立的,因此彩色电视和黑白电视可以同时使用,Y分量可由黑白电视接收机直接使用而不需做任何进一步的处理;②可以利用人的视觉特性来节省信号的带宽和功率,通过选择合适的颜色模型,可以使C1,C2的带宽明显低于Y的带宽,而又不明显影响重显彩色图像的观看。因此,为了满足兼容性的要求,彩色电视系统选择了一个亮度信号和两个色差信号,而不直接选择三个基色信号进行发送和接收。
10.2 彩色电视信号的类型
10.2.1 复合电视信号包含亮度信号、色差信号和所有定时信号的单一信号叫做复合电视信号(composite video signal),或者称为全电视信号。图10-04表示的是黑白全电视信号,而色差信号是通过色载波信号调制之后再和亮度信号混合得到,如图图10-05所示。
图10-04 一个行周期的黑白全电视信号
图10-05 彩色电视系统的水平消隐间隔
10.2.2 分量电视信号分量电视信号(component video signal)是指每个基色分量作为独立的电视信号。每个基色既可以用RGB表示,也可以用亮度-色差表示,如YIQ,YUV。使用分量电视信号是表示颜色的最好方法,但需要比较宽的带宽和同步信号。
10.2.3 S-Video信号分离电视信号S-Video(Separated video-VHS)是亮度和色差分离的一种电视信号,是分量模拟电视信号和复合模拟电视信号的一种折中方案。使用S-Video有两个优点:
(1) 减少亮度信号和色差信号之间的交叉干扰。
(2) 不须要使用梳状滤波器来分离亮度信号和色差信号,这样可提高亮度信号的带宽。
复合电视信号是把亮度信号和色差信号复合在一起,使用一条信号电缆线传输。而S-Video信号则使用单独的两条信号电缆线,一条用于亮度信号,另一条用于色差信号,这两个信号称为Y/C信号。S-Video使用4针连接器,如图10-06所示。具体的规格如表10-03所示。
图10-06 S-Video连接器
表10-03 S-Video工业标准4针连接器规格插座号
信号
信号电平
阻抗
1
地(亮度)
-
-
2
地(色度)
-
-
3
亮度(包含同步信号)
1V
75 ohms
4
色度
0.3V
75 ohms
需要注意的是,请不要把S-Video和S-VHS (Super Video Home System)相混淆,S-VHS是高档家用录像系统。S-Video是定义信号电缆连接插座的硬件标准,S-VHS或者写成SVHS是加强性VHS电视录像带的信号标准,提供的分辨率比VHS提供的分辨率要高一些,噪声信号要低一些。S-VHS支持分离的亮度和色度信号输入/输出,取消了亮度和色度的复合-分离过程。
10.3 电视图像数字化
10.3.1 数字化的方法数字电视图像有很多优点。例如,可直接进行随机存储使电视图像的检索变得很方便,复制数字电视图像和在网络上传输数字电视图像都不会造成质量下降,很容易进行非线性电视编辑。
在大多数情况下,数字电视系统都希望用彩色分量来表示图像数据,如用YCbCr,YUV,YIQ或RGB彩色分量。因此,电视图像数字化常用“分量数字化(component digitization)”这个术语,它表示对彩色空间的每一个分量进行数字化。电视图像数字化常用的方法有两种:
先从复合彩色电视图像中分离出彩色分量,然后数字化。我们现在接触到的大多数电视信号源都是彩色全电视信号,如来自录像带、激光视盘、摄像机等的电视信号。对这类信号的数字化,通常的做法是首先把模拟的全彩色电视信号分离成YCbCr,YUV,YIQ或RGB彩色空间中的分量信号,然后用三个A/D转换器分别对它们数字化。
首先用一个高速A/D转换器对彩色全电视信号进行数字化,然后在数字域中进行分离,以获得所希望的YCbCr,YUV,YIQ或RGB分量数据。详见参考文献和站点[4]。
10.3.2 数字化标准早在20世纪80年代初,国际无线电咨询委员会CCIR(International Radio Consultative Committee)就制定了彩色电视图像数字化标准,称为CCIR 601标准,现改为ITU-R BT.601标准。该标准规定了彩色电视图像转换成数字图像时使用的采样频率,RGB和YCbCr(或者写成YCBCR)两个彩色空间之间的转换关系等。
1,彩色空间之间的转换用8位二进制数表示BT.601的Y'CbCr和R'G'B',而R'G'B'颜色空间使用相同数值范围[0,219]的分量信号,R'G'B'和Y'CbCr两个彩色空间之间的转换关系用下式表示:
2,采样频率
CCIR为NTSC制、PAL制和SECAM制规定了共同的电视图像采样频率。这个采样频率也用于远程图像通信网络中的电视图像信号采样。
对PAL制、SECAM制,采样频率fs为
fs=625×25×N=15625×N=13.5 MHz,N=864
其中,N为每一扫描行上的采样数目。
对NTSC制,采样频率fs为
fs=525×29.97×N=15734×N=13.5 MHz,N=858
其中,N为每一扫描行上的采样数目。
采样频率和同步信号之间的关系如图10-07所示。
图10-07 采样频率
3,有效显示分辨率对PAL制和SECAM制的亮度信号,每一条扫描行采样864个样本;对NTSC制的亮度信号,每一条扫描行采样858个样本。对所有的制式,每一扫描行的有效样本数均为720个。每一扫描行的采样结构如图10-08所示。
图10-08 ITU-R BT.601的亮度采样结构
4,ITU-R BT.601标准摘要
ITU-R BT.601用于对隔行扫描电视图像进行数字化,对NTSC和PAL制彩色电视的采样频率和有效显示分辨率都作了规定。表10-04给出了ITU-R BT.601推荐的采样格式、编码参数和采样频率。
ITU-R BT.601推荐使用4∶2∶2的彩色电视图像采样格式。使用这种采样格式时,Y用13.5 MHz的采样频率,Cr,Cb用6.75 MHz的采样频率。采样时,采样频率信号要与场同步和行同步信号同步。
表10-04 彩色电视数数字化参数摘要采样格式
信号形式
采样频率
样本数/扫描行
数字信号取值
(MHz)
NTSC
PAL
范围(A/D)
Y
13.5
858(720)
864(720)
220级(16 ~235)
4:2:2
Cr
6.75
429(360)
432(360)
225级(16 ~240)
Cb
6.75
429(360)
432(360)
(128 ( 112)
Y
13.5
858(720)
864(720)
220级(16 ~235)
4:4:4
Cr
13.5
858(720)
864(720)
225级(16 ~240)
Cb
13.5
858(720)
864(720)
(128 ( 112)
按照ITU-R BT601标准,Y的取值范围是16~235,Cb和Cr的取值范围是16~240,把128作为偏移量,相当于0。
5,CIF、QCIF和SQCIF
为了既可用625行的电视图像又可用525行的电视图像,CCITT规定了称为公用中分辨率格式CIF(Common Intermediate Format),1/4公用中分辨率格式(Quarter-CIF,QCIF)和(Sub-Quarter Common Intermediate Format,SQCIF)格式,具体规格如表10-05所示。
CIF格式具有如下特性:
(1) 电视图像的空间分辨率为家用录像系统(Video Home System,VHS)的分辨率,即352×288。
(2) 使用非隔行扫描(non-interlaced scan)。
(3) 使用NTSC帧速率,电视图像的最大帧速率为30 000/1001≈29.97幅/秒。
(4) 使用1/2的PAL水平分辨率,即288线。
(5) 对亮度和两个色差信号(Y、Cb和Cr)分量分别进行编码,它们的取值范围同ITU-R BT.601。即黑色=16,白色=235,色差的最大值等于240,最小值等于16。
表10-05 CIF和QCIF图像格式参数
CIF
QCIF
SQCIF
行数/帧
像素/行
行数/帧
像素/行
行数/帧
像素/行
亮度(Y)
288
360(352)
144
180(176)
96
128
色度(Cb)
144
180(176)
72
90(88)
48
64
色度(Cr)
144
180(176)
72
90(88)
48
64
10.4 图像子采样
10.4.1 图像子采样概要对彩色电视图像进行采样时,可以采用两种采样方法。一种是使用相同的采样频率对图像的亮度信号和色差信号进行采样,另一种是对亮度信号和色差信号分别采用不同的采样频率进行采样。如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样(subsampling)。
图像子采样在数字图像压缩技术中得到广泛的应用。可以说,在彩色图像压缩技术中,最简便的图像压缩技术恐怕就要算图像子采样了。这种压缩方法的基本根据是人的视觉系统所具有的两条特性,一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。子采样也就是利用人的视觉系统这两个特性来达到压缩彩色电视信号的。
试验表明,使用下面介绍的子采样格式,人的视觉系统对采样前后显示的图像质量没有感到有明显差别。目前使用的子采样格式有如下几种:
(1) 4:4:4 这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用3个样本表示。
(2) 4:2:2 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。
(3) 4:1:1 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。
(4) 4:2:0 这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。
图10-09用图解的方法对以上4种子采样格式作了说明。
图10-09 彩色图像YCbCr样本空间位置
10.4.2 4:4:4 YCbCr格式图10-10说明625扫描行系统中采样格式为4:4:4的YCbCr的样本位置。对每个采样点,Y,Cb和Cr各取一个样本。对于消费类和计算机应用,每个分量的每个样本精度为8位;对于编辑类应用,每个分量的每个样本的精度为10位。因此每个像素的样本需要24位或者30位。
图10-10 4:4:4子采样格式
10.4.3 4:2:2 YCbCr格式图10-11说明625扫描行系统中采样格式为4:2:2的YCbCr的样本位置。在水平扫描方向上,每2个Y样本有1个Cb样本和一个Cr样本。对于消费类和计算机应用,每个分量的每个样本的精度为8位;对于编辑类应用,每个分量的每个样本精度为10位。因此每个像素的样本需要24位或者30位。在帧缓存中,每个样本需要16位或者20位。显示像素时,对于没有Cr和Cb的Y样本,使用前后相邻的Cr和Cb样本进行计算得到的Cr和Cb样本
图10-11 4:2:2子采样格式
10.4.4 4:1:1 YCbCr格式图10-12说明625扫描行系统中采样格式为4:1:1的YCbCr的样本位置。这是数字电视盒式磁带 (digital video cassette,DVC)上使用的格式。在水平扫描方向上,每4个Y样本各有1个Cb样本和一个Cr样本,每个分量的每个样本精度为8位。因此,在帧缓存中,每个样本需要12位。显示像素时,对于没有Cr和Cb的Y样本,使用前后相邻的Cr和Cb样本进行计算得到该Y样本的Cr和Cb样本。
图10-12 4:1:1子采样格式
10.4.5 4:2:0 YCbCr格式
(1) H.261,H.263和MPEG-1
图10-13说明625扫描行系统中采样格式为4:2:0的YCbCr的样本位置。这是H.261,H.263和MPEG-1使用的子采样格式。在水平方向的2个样本和垂直方向上的2个Y样本共4个样本有1个Cb样本和一个Cr样本。如果每个分量的每个样本精度为8位,在帧缓存中每个样本就需要12位。
图10-13 MPEG-1使用的4:2:0子采样格式
(2) MPEG-2
虽然MPEG-2和MPEG-1使用的子采样都是4:2:0,但它们的含义有所不同。图10-14说明采样格式为4:2:0的YCbCr空间样本位置。与MPEG-1的4:2:0相比,MPEG-2的子采样在水平方向上没有半个像素的偏移。
图10-14 MPEG-2的空间样本位置
练习与思考题世界上主要的彩色电视制式是哪几种?
隔行扫描是什么意思?非隔行扫描是什么意思?
电视机和计算机的显示器各使用什么扫描方式?
ITU-R BT.601标准规定PAL和NTSC彩色电视的每一条扫描线的有效显示像素是多少?
什么叫做S-Video?它的连接器结构是什么样?
对彩色图像进行子采样的理论根据是什么?
图像子采样是在哪个彩色空间进行的?
一幅YUV彩色图像的分辨率为720×576。分别计算采用4:2:2、4:1:1和4:2:0子采样格式采样时的样本数。
参考文献和站点
http://www.video-demystified.com/home.htm (重访日期:2001年12月)
http://www.hut.fi/Misc/Electronics/video.html (重访日期:2001年12月)
林福宗,陆 达 编著,多媒体与CD-ROM,北京:清华大学出版社,1995.3,338-346
***************************************************************************
10.1 彩色电视制式
10.1.1 简介
10.1.2 电视扫描和同步
10.1.3 彩色电视
10.2 彩色电视信号的类型
10.2.1 复合电视信号
10.2.2 分量电视信号
10.2.3 S-Video信号
10.3 电视图像数字化
10.3.1 数字化的方法
10.3.2 数字化标准
10.4 图像子采样
10.4.1 图像子采样概要
10.4.2 4:4:4 YCbCr格式
10.4.3 4:2:2 YCbCr格式
10.4.4 4:1:1 YCbCr格式
10.4.5 4:2:0 YCbCr格式练习与思考题参考文献和站点
***************************************************************************
电视是当代最有影响力的信息传播工具!
电视是20世纪20年代的伟大发明,在50年代开发电视技术时,用任何一种数字技术来传输和再现真实世界的图像和声音都是极其困难的,因此电视技术一直沿着模拟信号处理技术的方向发展,直到70年代才开始开发数字电视。由于数字技术具有许多优越性,而且数字技术发展到足以使模拟电视向数字电视过渡的水平,电视和计算机才开始融合在一起。
彩色数字电视是从模拟电视和模拟彩色电视发展而来的,因此本章的前半部分将介绍模拟电视的一些基本常识,而后半部分将介绍彩色数字电视的基本常识。这些基本常识对理解MPEG电视是极其有用的。
10.1 彩色电视制式
10.1.1 简介目前世界上现行的彩色电视制式有三种:NTSC制、PAL制和SECAM制。这里不包括高清晰度彩色电视HDTV (High-Definition television)。数字彩色电视是从模拟彩色电视基础上发展而来的,因此在多媒体技术中经常会碰到这些术语。
NTSC(National Television Systems Committee)彩色电视制是1952年美国国家电视标准委员会定义的彩色电视广播标准,称为正交平衡调幅制。美国、加拿大等大部分西半球国家,以及日本、韩国、菲律宾等国和中国的台湾采用这种制式。
由于NTSC制存在相位敏感造成彩色失真的缺点,因此德国(当时的西德)于1962年制定了PAL(Phase-Alternative Line)制彩色电视广播标准,称为逐行倒相正交平衡调幅制。德国、英国等一些西欧国家,以及中国、朝鲜等国家采用这种制式。
法国制定了SECAM (法文:Sequential Coleur Avec Memoire)彩色电视广播标准,称为顺序传送彩色与存储制。法国、苏联及东欧国家采用这种制式。世界上约有65个地区和国家试验这种制式。
NTSC制、PAL制和SECAM制都是兼容制制式。这里说的“兼容”有两层意思:一是指黑白电视机能接收彩色电视广播,显示的是黑白图像,另一层意思是彩色电视机能接收黑白电视广播,显示的也是黑白图像,这叫逆兼容性。为了既能实现兼容性而又要有彩色特性,因此彩色电视系统应满足下列几方面的要求:
(1) 必需采用与黑白电视相同的一些基本参数,如扫描方式、扫描行频、场频、帧频、同步信号、图像载频、伴音载频等等。
(2) 需要将摄像机输出的三基色信号转换成一个亮度信号,以及代表色度的两个色差信号,并将它们组合成一个彩色全电视信号进行传送。在接收端,彩色电视机将彩色全电视信号重新转换成三个基色信号,在显象管上重现发送端的彩色图像。
10.1.2 电视扫描和同步扫描有隔行扫描(interlaced scanning)和非隔行扫描之分。非隔行扫描也称逐行扫描,图10-01表示了这两种扫描方式的差别。黑白电视和彩色电视都用隔行扫描,而计算机显示图像时一般都采用非隔行扫描。
(a) 逐行扫描
(b) 隔行扫描图10-01 图像的光栅扫描
在非隔行扫描中,电子束从显示屏的左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整的图像,如图10-01(a)所示。
在隔行扫描中,电子束扫完第1行后回到第3行开始的位置接着扫,如图10-01(b)所示,然后在第5、7、……,行上扫,直到最后一行。奇数行扫完后接着扫偶数行,这样就完成了一帧(frame)的扫描。由此可以看到,隔行扫描的一帧图像由两部分组成:一部分是由奇数行组成,称奇数场,另一部分是由偶数行组成,称为偶数场,两场合起来组成一帧。因此在隔行扫描中,无论是摄像机还是显示器,获取或显示一幅图像都要扫描两遍才能得到一幅完整的图像。
在隔行扫描中、扫描的行数必须是奇数。如前所述,一帧画面分两场,第一场扫描总行数的一半,第二场扫描总行数的另一半。隔行扫描要求第一场结束于最后一行的一半,不管电子束如何折回,它必须回到显示屏顶部的中央,这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。正是这个原因,才要求总的行数必须是奇数。
每秒钟扫描多少行称为行频fH;每秒钟扫描多少场称为场频ff;每秒扫描多少帧称帧频fF。ff和fF是两个不同的概念。
1,PAL制电视的扫描特性
PAL电视制的主要扫描特性是:
(1) 625行(扫描线)/帧,25帧/秒(40 ms/帧)
(2) 高宽比(aspect ratio):4:3
(3) 隔行扫描,2场/帧,312.5行/场
(4) 颜色模型:YUV。
一帧图像的总行数为625,分两场扫描。行扫描频率是15 625 Hz,周期为64μs;场扫描频率是50 Hz,周期为20 ms;帧频是25 Hz,是场频的一半,周期为40 ms。在发送电视信号时,每一行中传送图像的时间是52.2μs,其余的11.8μs不传送图像,是行扫描的逆程时间,同时用作行同步及消隐用。每一场的扫描行数为625/2=312.5行,其中25行作场回扫,不传送图像,传送图像的行数每场只有287.5行,因此每帧只有575行有图像显示。图10-02所示表示的是一个行周期的电视信号,彩色电视信号与它相似。
图10-02 一个行周期的电视信号(黑白电视系统)
2,NTSC制的扫描特性
NTSC彩色电视制的主要特性是:
(1) 525行/帧,30帧/秒(29.97 fps,33.37 ms/frame)
(2) 高宽比:电视画面的长宽比(电视为4:3;电影为3:2;高清晰度电视为16:9)
(3) 隔行扫描,一帧分成2场(field),262.5线/场
(4) 在每场的开始部分保留20扫描线作为控制信息,因此只有485条线的可视数据。Laser disc约~420线,S-VHS约~320线
(5) 每行63.5微秒,水平回扫时间10微秒(包含5微秒的水平同步脉冲),所以显示时间是53.5微秒。
(6) 颜色模型:YIQ
一帧图像的总行数为525行,分两场扫描。行扫描频率为15 750 Hz,周期为63.5μs;场扫描频率是60 Hz,周期为16.67 ms;帧频是30 Hz,周期33.33 ms。每一场的扫描行数为525/2=262.5行。除了两场的场回扫外,实际传送图像的行数为480行。
3,SECAM
SECAM (法文:Sequential Coleur Avec Memoire)制式是法国开发的一种彩色电视广播标准,称为顺序传送彩色与存储制。这种制式与PAL制类似,其差别是SECAM中的色度信号是频率调制(FM),而且它的两个色差信号:红色差(R'-Y')和蓝色差(B'-Y')信号是按行的顺序传输的。法国、俄罗斯、东欧和中东等约有65个地区和国家使用这种制式,图像格式为4:3,625线,50 Hz,6 MHz电视信号带宽,总带宽8 MHz。
以上三种电视制式的主要特性如表10-01和表10-02所示。
表10-01 彩色电视的同步信号
TV制式
PAL
NTSC
SECAM
行周期(H)
64.0
63.55
64.0
水
消隐宽度
11.8
10.8
11.8
平
同步宽度
4.7
4.7
4.7
定
前肩
1.3
1.3
1.3
时
色同步起点
5.6
5.1
—
(μs)
色同步宽度
2.25
2.67
—
均衡脉冲宽度
2.35
2.3
2.35
场同步脉冲宽度
27.3
27.1
27.3
垂直
消隐宽度
25H
20H
25H
(场)
均衡脉冲数
5
6
5
同步
场同步脉冲数
5
6
5
表10-02 彩色电视国际标准
TV制式
PAL
G I D
NTSC
M
SECAM
行/帧
625
525
625
帧/秒(场/秒)
25(50)
30(60)
25(50)
行/秒
15625
15734
15625
参考白光
C白
D6500
D6500
声音载频(MHz)
5.5 6.0 6.5
4.5
6.5
γ
2.8
2.2
2.8
彩色副载频(Hz)
4433618
3579545
4250000(+U)
4406500(-V)
彩色调制
QAM
QAM
FM
亮度带宽(MHz)
5.0 5.5
4.2
6.0
色度带宽(MHz)
1.3(Ut)
1.3(Vt)
1.3(I) 0.6(Q)
>1.0(Ut)
>1.0(Vt)
10.1.3 彩色电视彩色电视是在黑白电视基础上发展起来的。彩色电视的许多特性,如扫描、同步等都与黑白电视相同,不同的是显示的图像的颜色不同。
根据三基色的基本原理,任何一种颜色都可以用R、G、B三个彩色分量按一定的比例混合得到,但要精确地复显自然景物中的彩色确是相当困难的。值得庆幸的是,科学家们对人的彩色视觉特性经过长期研究后发现,在重显自然景物彩色过程中,并不一定要恢复原景物辐射的所有光波成分,而重要的是获得与原景物相同的彩色感觉。
图10-03说明用彩色摄像机摄取景物时,如何把自然景物的彩色分解为R、G、B分量,以及如何重显自然景物彩色的过程。
图10-03 彩色图像重现过程
按照色度学的基本原理,用R、G、B三基色的各种线性组合可以构造出各种不同的彩色空间来表示景物的颜色。各种不同的彩色空间在不同的应用中也许会比原始的RGB彩色空间具有更有用的特性,更有效且更经济。因此在彩色电视中,用Y、C1,C2彩色表示法分别表示亮度信号和两个色差信号,C1,C2的含义与具体的应用有关。在NTSC彩色电视制中,C1,C2分别表示I、Q两个色差信号;在PAL彩色电视制中,C1,C2分别表示U、V两个色差信号;在CCIR 601数字电视标准中,C1,C2分别表示Cr,Cb两个色差信号。所谓色差是指基色信号中的三个分量信号(即R、G、B)与亮度信号之差。
在彩色电视中,使用Y、C1,C2有两个重要优点:①Y和C1,C2是独立的,因此彩色电视和黑白电视可以同时使用,Y分量可由黑白电视接收机直接使用而不需做任何进一步的处理;②可以利用人的视觉特性来节省信号的带宽和功率,通过选择合适的颜色模型,可以使C1,C2的带宽明显低于Y的带宽,而又不明显影响重显彩色图像的观看。因此,为了满足兼容性的要求,彩色电视系统选择了一个亮度信号和两个色差信号,而不直接选择三个基色信号进行发送和接收。
10.2 彩色电视信号的类型
10.2.1 复合电视信号包含亮度信号、色差信号和所有定时信号的单一信号叫做复合电视信号(composite video signal),或者称为全电视信号。图10-04表示的是黑白全电视信号,而色差信号是通过色载波信号调制之后再和亮度信号混合得到,如图图10-05所示。
图10-04 一个行周期的黑白全电视信号
图10-05 彩色电视系统的水平消隐间隔
10.2.2 分量电视信号分量电视信号(component video signal)是指每个基色分量作为独立的电视信号。每个基色既可以用RGB表示,也可以用亮度-色差表示,如YIQ,YUV。使用分量电视信号是表示颜色的最好方法,但需要比较宽的带宽和同步信号。
10.2.3 S-Video信号分离电视信号S-Video(Separated video-VHS)是亮度和色差分离的一种电视信号,是分量模拟电视信号和复合模拟电视信号的一种折中方案。使用S-Video有两个优点:
(1) 减少亮度信号和色差信号之间的交叉干扰。
(2) 不须要使用梳状滤波器来分离亮度信号和色差信号,这样可提高亮度信号的带宽。
复合电视信号是把亮度信号和色差信号复合在一起,使用一条信号电缆线传输。而S-Video信号则使用单独的两条信号电缆线,一条用于亮度信号,另一条用于色差信号,这两个信号称为Y/C信号。S-Video使用4针连接器,如图10-06所示。具体的规格如表10-03所示。
图10-06 S-Video连接器
表10-03 S-Video工业标准4针连接器规格插座号
信号
信号电平
阻抗
1
地(亮度)
-
-
2
地(色度)
-
-
3
亮度(包含同步信号)
1V
75 ohms
4
色度
0.3V
75 ohms
需要注意的是,请不要把S-Video和S-VHS (Super Video Home System)相混淆,S-VHS是高档家用录像系统。S-Video是定义信号电缆连接插座的硬件标准,S-VHS或者写成SVHS是加强性VHS电视录像带的信号标准,提供的分辨率比VHS提供的分辨率要高一些,噪声信号要低一些。S-VHS支持分离的亮度和色度信号输入/输出,取消了亮度和色度的复合-分离过程。
10.3 电视图像数字化
10.3.1 数字化的方法数字电视图像有很多优点。例如,可直接进行随机存储使电视图像的检索变得很方便,复制数字电视图像和在网络上传输数字电视图像都不会造成质量下降,很容易进行非线性电视编辑。
在大多数情况下,数字电视系统都希望用彩色分量来表示图像数据,如用YCbCr,YUV,YIQ或RGB彩色分量。因此,电视图像数字化常用“分量数字化(component digitization)”这个术语,它表示对彩色空间的每一个分量进行数字化。电视图像数字化常用的方法有两种:
先从复合彩色电视图像中分离出彩色分量,然后数字化。我们现在接触到的大多数电视信号源都是彩色全电视信号,如来自录像带、激光视盘、摄像机等的电视信号。对这类信号的数字化,通常的做法是首先把模拟的全彩色电视信号分离成YCbCr,YUV,YIQ或RGB彩色空间中的分量信号,然后用三个A/D转换器分别对它们数字化。
首先用一个高速A/D转换器对彩色全电视信号进行数字化,然后在数字域中进行分离,以获得所希望的YCbCr,YUV,YIQ或RGB分量数据。详见参考文献和站点[4]。
10.3.2 数字化标准早在20世纪80年代初,国际无线电咨询委员会CCIR(International Radio Consultative Committee)就制定了彩色电视图像数字化标准,称为CCIR 601标准,现改为ITU-R BT.601标准。该标准规定了彩色电视图像转换成数字图像时使用的采样频率,RGB和YCbCr(或者写成YCBCR)两个彩色空间之间的转换关系等。
1,彩色空间之间的转换用8位二进制数表示BT.601的Y'CbCr和R'G'B',而R'G'B'颜色空间使用相同数值范围[0,219]的分量信号,R'G'B'和Y'CbCr两个彩色空间之间的转换关系用下式表示:
2,采样频率
CCIR为NTSC制、PAL制和SECAM制规定了共同的电视图像采样频率。这个采样频率也用于远程图像通信网络中的电视图像信号采样。
对PAL制、SECAM制,采样频率fs为
fs=625×25×N=15625×N=13.5 MHz,N=864
其中,N为每一扫描行上的采样数目。
对NTSC制,采样频率fs为
fs=525×29.97×N=15734×N=13.5 MHz,N=858
其中,N为每一扫描行上的采样数目。
采样频率和同步信号之间的关系如图10-07所示。
图10-07 采样频率
3,有效显示分辨率对PAL制和SECAM制的亮度信号,每一条扫描行采样864个样本;对NTSC制的亮度信号,每一条扫描行采样858个样本。对所有的制式,每一扫描行的有效样本数均为720个。每一扫描行的采样结构如图10-08所示。
图10-08 ITU-R BT.601的亮度采样结构
4,ITU-R BT.601标准摘要
ITU-R BT.601用于对隔行扫描电视图像进行数字化,对NTSC和PAL制彩色电视的采样频率和有效显示分辨率都作了规定。表10-04给出了ITU-R BT.601推荐的采样格式、编码参数和采样频率。
ITU-R BT.601推荐使用4∶2∶2的彩色电视图像采样格式。使用这种采样格式时,Y用13.5 MHz的采样频率,Cr,Cb用6.75 MHz的采样频率。采样时,采样频率信号要与场同步和行同步信号同步。
表10-04 彩色电视数数字化参数摘要采样格式
信号形式
采样频率
样本数/扫描行
数字信号取值
(MHz)
NTSC
PAL
范围(A/D)
Y
13.5
858(720)
864(720)
220级(16 ~235)
4:2:2
Cr
6.75
429(360)
432(360)
225级(16 ~240)
Cb
6.75
429(360)
432(360)
(128 ( 112)
Y
13.5
858(720)
864(720)
220级(16 ~235)
4:4:4
Cr
13.5
858(720)
864(720)
225级(16 ~240)
Cb
13.5
858(720)
864(720)
(128 ( 112)
按照ITU-R BT601标准,Y的取值范围是16~235,Cb和Cr的取值范围是16~240,把128作为偏移量,相当于0。
5,CIF、QCIF和SQCIF
为了既可用625行的电视图像又可用525行的电视图像,CCITT规定了称为公用中分辨率格式CIF(Common Intermediate Format),1/4公用中分辨率格式(Quarter-CIF,QCIF)和(Sub-Quarter Common Intermediate Format,SQCIF)格式,具体规格如表10-05所示。
CIF格式具有如下特性:
(1) 电视图像的空间分辨率为家用录像系统(Video Home System,VHS)的分辨率,即352×288。
(2) 使用非隔行扫描(non-interlaced scan)。
(3) 使用NTSC帧速率,电视图像的最大帧速率为30 000/1001≈29.97幅/秒。
(4) 使用1/2的PAL水平分辨率,即288线。
(5) 对亮度和两个色差信号(Y、Cb和Cr)分量分别进行编码,它们的取值范围同ITU-R BT.601。即黑色=16,白色=235,色差的最大值等于240,最小值等于16。
表10-05 CIF和QCIF图像格式参数
CIF
QCIF
SQCIF
行数/帧
像素/行
行数/帧
像素/行
行数/帧
像素/行
亮度(Y)
288
360(352)
144
180(176)
96
128
色度(Cb)
144
180(176)
72
90(88)
48
64
色度(Cr)
144
180(176)
72
90(88)
48
64
10.4 图像子采样
10.4.1 图像子采样概要对彩色电视图像进行采样时,可以采用两种采样方法。一种是使用相同的采样频率对图像的亮度信号和色差信号进行采样,另一种是对亮度信号和色差信号分别采用不同的采样频率进行采样。如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样(subsampling)。
图像子采样在数字图像压缩技术中得到广泛的应用。可以说,在彩色图像压缩技术中,最简便的图像压缩技术恐怕就要算图像子采样了。这种压缩方法的基本根据是人的视觉系统所具有的两条特性,一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。子采样也就是利用人的视觉系统这两个特性来达到压缩彩色电视信号的。
试验表明,使用下面介绍的子采样格式,人的视觉系统对采样前后显示的图像质量没有感到有明显差别。目前使用的子采样格式有如下几种:
(1) 4:4:4 这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用3个样本表示。
(2) 4:2:2 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。
(3) 4:1:1 这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。
(4) 4:2:0 这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。
图10-09用图解的方法对以上4种子采样格式作了说明。
图10-09 彩色图像YCbCr样本空间位置
10.4.2 4:4:4 YCbCr格式图10-10说明625扫描行系统中采样格式为4:4:4的YCbCr的样本位置。对每个采样点,Y,Cb和Cr各取一个样本。对于消费类和计算机应用,每个分量的每个样本精度为8位;对于编辑类应用,每个分量的每个样本的精度为10位。因此每个像素的样本需要24位或者30位。
图10-10 4:4:4子采样格式
10.4.3 4:2:2 YCbCr格式图10-11说明625扫描行系统中采样格式为4:2:2的YCbCr的样本位置。在水平扫描方向上,每2个Y样本有1个Cb样本和一个Cr样本。对于消费类和计算机应用,每个分量的每个样本的精度为8位;对于编辑类应用,每个分量的每个样本精度为10位。因此每个像素的样本需要24位或者30位。在帧缓存中,每个样本需要16位或者20位。显示像素时,对于没有Cr和Cb的Y样本,使用前后相邻的Cr和Cb样本进行计算得到的Cr和Cb样本
图10-11 4:2:2子采样格式
10.4.4 4:1:1 YCbCr格式图10-12说明625扫描行系统中采样格式为4:1:1的YCbCr的样本位置。这是数字电视盒式磁带 (digital video cassette,DVC)上使用的格式。在水平扫描方向上,每4个Y样本各有1个Cb样本和一个Cr样本,每个分量的每个样本精度为8位。因此,在帧缓存中,每个样本需要12位。显示像素时,对于没有Cr和Cb的Y样本,使用前后相邻的Cr和Cb样本进行计算得到该Y样本的Cr和Cb样本。
图10-12 4:1:1子采样格式
10.4.5 4:2:0 YCbCr格式
(1) H.261,H.263和MPEG-1
图10-13说明625扫描行系统中采样格式为4:2:0的YCbCr的样本位置。这是H.261,H.263和MPEG-1使用的子采样格式。在水平方向的2个样本和垂直方向上的2个Y样本共4个样本有1个Cb样本和一个Cr样本。如果每个分量的每个样本精度为8位,在帧缓存中每个样本就需要12位。
图10-13 MPEG-1使用的4:2:0子采样格式
(2) MPEG-2
虽然MPEG-2和MPEG-1使用的子采样都是4:2:0,但它们的含义有所不同。图10-14说明采样格式为4:2:0的YCbCr空间样本位置。与MPEG-1的4:2:0相比,MPEG-2的子采样在水平方向上没有半个像素的偏移。
图10-14 MPEG-2的空间样本位置
练习与思考题世界上主要的彩色电视制式是哪几种?
隔行扫描是什么意思?非隔行扫描是什么意思?
电视机和计算机的显示器各使用什么扫描方式?
ITU-R BT.601标准规定PAL和NTSC彩色电视的每一条扫描线的有效显示像素是多少?
什么叫做S-Video?它的连接器结构是什么样?
对彩色图像进行子采样的理论根据是什么?
图像子采样是在哪个彩色空间进行的?
一幅YUV彩色图像的分辨率为720×576。分别计算采用4:2:2、4:1:1和4:2:0子采样格式采样时的样本数。
参考文献和站点
http://www.video-demystified.com/home.htm (重访日期:2001年12月)
http://www.hut.fi/Misc/Electronics/video.html (重访日期:2001年12月)
林福宗,陆 达 编著,多媒体与CD-ROM,北京:清华大学出版社,1995.3,338-346