第九章 颜色视觉 9.1 颜色现象 9.1.1 颜色的基本性质 9.1.2 颜色立体 9.1.3 颜色的交互作用和颜色恒常性 9.1.4 颜色的混合 9.2 颜色的匹配和标定 9.2.1 颜色的匹配和颜色方程 9.2.2 色度图和色度坐标 9.2.3 颜色相加原理 9.2.4 颜色的标定 9.3 颜色视觉理论 9.3.1 三色理论 9.3.2 颜色对立机制理论 9.3.3 视网膜皮层理论 9.4 颜色信息的计算机处理 9.4.1 系统颜色空间的标定 9.4.2 色度信息的表示 9.4.3 颜色图象分割和颜色反射模型 9.1 颜色现象 9.1.1 颜色的基本性质   颜色是外界光刺激作用于人的视觉器官而产生的主观感觉。所以颜色特性既可以从客观刺激方面来衡量,也可以从观察者的主观感觉方面来描述。描述客观刺激的概念是心理物理学概念;描述观察者主观感觉的概念是心理学概念。确定光的心理物理量与心理量的关系是感觉心理学研究的重要任务。颜色视觉有三种特性,描述颜色的心理物理量是亮度、主波长和纯度,相应的心理量是明度,色调和饱和度。   颜色分两大类:非彩色和彩色。非彩色是指黑色、白色和介于这两者之间深浅不同的灰色。它们可以排成一个系列,由白色逐渐到浅灰、中灰、深灰直到黑色。这叫白黑系列或无色系列。白黑系列由白到黑的变化可以用一条直线代表,一端是纯白,另一端是纯黑。中间有着各种不同等级的灰色过渡(图9.1)。所谓灰色是相对的,比周围明亮的称为浅灰,比周围暗的称为深灰,灰色是最不饱和色之一。所谓纯白和纯黑也是相对而言的,并无绝对的标准,白雪接近纯白,黑绒接近纯黑,由白和黑按不同比例混合可得出各种灰色。白色和各种灰色是物体表面没有选择性的反射。白黑系列的非彩色的反射率代表物体的明度。反射率越高时接近白色,反射率低时接近黑色。一张洁白的纸的反射率可达85%以上。用来测量颜色、定标用的标准白板的反射率可达90%以上。一张黑纸的反射率可低至5%以下,黑色天鹅绒的反射率甚至可低于0.05%。  图9.1 白黑系列   表示光的强度的心理物理学概念是亮度(Luminosity)。所有的光,不论是什么颜色都可以用亮度来测量。非彩色的白黑变化相应于白光的亮度变化。当白光的亮度非常高时,人眼就感觉到是白色的;当光的亮度很低时,就感觉到发暗或发灰;无光时是黑色的。与亮度相应的心理学概念是明度(brightness)。明度是人眼对物体的明亮感觉,受视觉感受性和过去经验的影响。通常明度的变化相应于亮度的变化。物体表面或光源的亮度越高,人感觉到的明度就越高。但二者的关系并不固定。若亮度的微小增加或减少达不到人眼的分辨阈限,眼睛就觉察不出明度的变化。这时亮度虽有变化而明度却不变。在暗环境中观察一张高反射率的书页与在亮环境中观察一块低反射率的黑墨相比,虽然可能后者的亮度大于前者,但由于观察者已经知道它们是书页和黑墨,所以书页仍感觉为白色,而黑墨仍为黑色,有较低的明度。这是因为观察者有对书页和黑墨的记忆和经验,有周围其它物体的相对明度作参考,以及对不同照明条件的认识影响了明度感觉。   彩色系列或有色系列是指除了白黑系列以外的各种颜色。我们通常所说的颜色即指彩色。彩色的第一个特性是用心理物理量亮度和心理量明度来表示的。所有的光,不论是什么颜色都可以用光的亮度来定量。与非彩色相似,彩色光的亮度越高,人眼就感觉明亮,或者说有较高的明度。彩色物体表面的反射率越高,它的明度就越高。   表示彩色的第二个特性的心理物理学概念是主波长(dominant wavelength)。与主波长相应的心理学概念是色调(hue)。光谱是由不同波长的光组成的。用三棱镜可以把日光分解成光谱上不同波长的光,不同波长所引起的不同感觉就是色调。例如,700纳米波长光的色调是红色,579纳米波长光的色调是黄色,500纳米光的色调是绿色等。若将几种主波长不同的光按适当的比例加以混合,则能产生不具有任何色调的感觉,也就是白色。事实上,只选择两种主波长不同的光以适当的比例加以混合也能产生白色。这样的一对主波长的光叫做互补波长。例如,600纳米的橙色和492纳米的蓝绿色是一对互补波长;575.5纳米的黄色和474.5纳米的蓝色也是互补波长。一对互补波长的色调叫互补色。光源的色调决定于人眼对辐射光的光谱组成产生的感觉。物体的色调决定于光源的光谱组成和物体表面反射(透射)的各波长的比例对人眼产生的感觉。例如,在日光下,一个物体反射480-560纳米波段的辐射,而相对吸收其它波长的辐射,那么该物体表面为绿色。   表示彩色第三个特性的心理物理学概念是颜色纯度(purity),其相应的心理学概念是饱和度(saturation)。纯色是指没有混入白色的窄带单色光。在视觉上就是高饱和度的颜色。可见光谱的各种单色光是最饱和的彩色。当光谱色搀入白光成分越多时,就越不饱和。例如,主波长为650纳米的光是非常纯的红光。如果把一定数量的白光加到这个红光上,混合的结果便产生粉红色。加入的白光越多,混合后的颜色光就越不纯,看起来就越不饱和。   光刺激的心理物理特性可以按亮度,主波长和纯度来确定。这些特性又分别同明度、色调、饱和度的主观感觉相联系。颜色可分为彩色和非彩色。光刺激如果没有主波长,这个光就是非彩色的白光,它没有纯度。然而所有视觉刺激都有亮度特性。亮度是彩色刺激和非彩色刺激的共同特性,而主波长和纯度表示刺激是彩色的。 9.1.2 颜色立体   用一个三维空间纺锤体形立体可以把颜色的三种基本特性—明度、色调和饱和度全部表示出来(图9.2)。在颜色立体中垂直轴代表白黑系列明度的变化。顶端是白色,中间  图9.2 颜色立体 是各种灰度的过渡,底部是黑色。沿垂直轴的上下方向,越在上方明度就越大。色调由水平的圆周表示。圆周上的各点代表光谱上各种不同的色调(红、橙、黄、绿、蓝、紫)。图形的中心是中灰色。中灰色的明度和圆周上各种色调的明度相同。从圆周向圆心过渡表示颜色饱和度逐渐降低。当颜色在立体的同一平面变化时只改变色调或饱和度而不改变明度。   这个颜色纺缍体只是一个理想化的示意模型。目的是使人们更容易理解颜色三特性的相互关系。在真实的颜色关系中,饱和度最大的黄色并不在中等明度的地方,而是在靠近白色的明度较高处;饱和度最大的蓝色则在靠近黑色的明度较低处。因此,颜色立体中部的色调图象平面应该是倾斜的,黄色部分较高,蓝色部分较低。而且色调平面圆周上的各种饱和色调离开垂直轴的距离也不一样,某些颜色能达到较高的饱和度,所以这个圆形平面并不是真正的圆形。 9.1.3 颜色的交互作用和颜色恒常性   我们在某一物体表面所看到的颜色不仅取决于这个表面本身产生的物理刺激,而且还取决于同时呈现在它周围的颜色。物体本身的颜色和它周围颜色的交互作用能影响被看表面的色调和明度。当被看的颜色向它周围颜色的对立方向转化,即向周围颜色的补色方向变化时,叫做颜色的同时交互作用,或颜色对比。例如,在红色背景中放一小块白纸或灰纸,用眼睛注视白纸几分钟,白纸会表现出绿色。如果背景是黄色,白纸会出现蓝色。红和绿是互补色,黄和蓝也是互补色。   当在一个颜色(包括灰色)的周围呈现高亮度或低亮度刺激时,这个颜色就向其周围明度的对立方向转化,这叫做明度对比。白背景上的灰方块呈浅黑色,而黑背景上的灰方块则呈白色等。对比效应在视觉中有重要作用,明度对比更是这样。它与视觉中的颜色恒常性相联系。一块煤在阳光下单位面积反射光比一张白纸在黑暗处时高一千倍。但我们仍然把煤看成是黑的,而把纸看成是白的、灰的、或黑的。这是由这个物体与周围物体的相对明度关系决定的。白纸不管在什么样的照明条件下都是白的,而煤仍然是黑的。这就是说,尽管外界的条件发生变化,人们仍然根据物体的固有颜色来感知它们。这是颜色恒常性的表现。在一天的过程中,我们周围物体所受的照度会有很大的变化。中午时的照度要比日出时和日落时高几百倍。但在日常生活中,当照明条件变化时我们的视觉仍能保持对物体颜色的恒常性,这才使我们对周围物体有正确的认识。   颜色恒常性还表现在当光源的光谱成分发生变化时被观察物体的颜色在一定程度上看起来仍然保持不变。例如,室内不管由白炽灯的黄光或萤光灯的蓝光照明,书页纸看起来都是白色的。但如果让被试验者通过一个圆筒,只看到被照射物体的一小块面积,同时又不让他知道是用哪一种色光照射时,一张白纸在用红光照射时就会被看成是红色的。   一个物体的明度和色调不仅取决于当前的刺激,而且也与先前刺激的后效有关。这种后效叫相继交互作用,或相继对比效应。例如,我们看一个红色方块一段时间后再注意看一个均匀的灰色表面,就会看到一个很快消失的绿色方块的映象,映象的颜色是诱导颜色的补色,这样产生的映象叫做负后象。对黑色和白色也是同样的情况,黑色的负后象是白色,而白色的负后象是黑色。后象也可以是与原来刺激相同的颜色,这种后象叫做正后象。 9.1.4 颜色的混合   对颜色混合的研究可追溯到十七世纪后期牛顿的工作。他用棱镜把太阳光分散成光谱上的颜色光带。牛顿通过实验证明了:(1) 白光是由很多不同颜色的光混合而成的结果;(2) 作为白光成分的单色光具有不同的折射度。牛顿进一步进行了颜色混合的实验,让白光通过两个棱镜以产生两个光谱,再设法使两个光谱上的单色光相混合。牛顿发现光谱上的两种颜色相混合会出现一种新的颜色。绿光和红光混合会出现黄色,黄光和红光混合会出现橙色,而且在光谱上能找到这个颜色,它位于红和黄之间。一般来说,光谱上临近的两种颜色混合所产生的新颜色处于光谱上两种被混合颜色的中间,称为中间色。但也有例外。例如,两种颜色在光谱上距离很远。它们混合所产生的新颜色可能是灰色或白色,这叫中性颜色。光谱两端的红光和蓝色相混合会出现一个光谱上找不到的新颜色,这个颜色是紫色,它被叫做非光谱色。 颜色混合的各种规律可以用叫做颜色环的理想示意图来表示。若把饱和度最高的光谱色依顺序围成一个环再加上紫红色就构成了图9.3所示的颜色环。圆环的圆周代表色调,白色位于圆环中心。每一种颜色都在圆环上或圆环内占一确定位置。颜色越不饱和其位置越靠近中心。   这个模型可用来定性地预测各种颜色光相混合的结果。例如,圆周上的b点代表480纳米的蓝色光,g点代表520纳米的绿色光。如果这两种光以相等的亮度相混合,那么我们用直线连接圆周上的b,g两点,再由圆心画一条线过这条线的中点,并落在圆周的bg点上,这一点的颜色就是这两种颜色相混合的结果,它是蓝绿色。又例如,当r(红)和g(绿)两种颜色相混合时,我们就从r点到g点连接一条直线,如果r和g分别代表660纳米的红光和520纳米的绿光,两者又是等量混合的话,这条线就通过圆环的中心,这说明混合的结果是一个中性颜色,而这两个相混合的颜色则互为补色。480纳米蓝光和660纳米红光相混合将呈现紫色,这个颜色在光谱上是没有的,但在颜色环上能表示出来。它位于红、蓝之间。圆环模型的优点是它是一个封闭的图形能使相似的颜色彼此靠近,并能将由颜色混合产生的非光谱色表现出来。  图9.3 颜色环   十九世纪初,Yaung提出某一波长的光可以通过三种不同波长的光相混合而复现出来的假设。他认为红(R) 、绿(G) 、蓝(B)这三种单色光可以作为基本的颜色—原色,把这三种光按不同的比例混合就能准确地复现出任何其它波长的光。当把它们以等量混合时会产生中性的颜色—白光(W),后来Maxwell用旋转圆盘所做的颜色混合实验证明了Yaung 的假设。Maxwell证明在颜色圆盘上按不同的比例混合三种颜色可以产生任何色调。他还证明这三种颜色不一定是红、绿、蓝,任何三种颜色,只要混合后能产生中性色,都可以起原色作用。用三种原色能产生各种颜色的原理是当今颜色科学中最重要的原理。这个原理经过Helmhotz的进一步发展形成了颜色视觉机制学说,即三种感受器理论,或称为三色学说。   颜色混合的另一个重要特点是颜色可以相互代替。例如,黄光和蓝光混合得白光。若没有黄光,用红光和绿光混合得出黄光,这一混合的黄光与蓝光混合仍得白光。颜色混合的一个重要原则是只要外貌上相同的颜色,不管它原来组合的成分是什么,在视觉系统上产生的效应都是相同的。色调决定于波长,每一种波长都产生一定色调,但每一种色调并不只和一种特定的波长相联系。我们从波长520纳米的单色光得到绿光,同样也可以从510和530纳米的光线混合得到绿光,这种绿光还可以从其它大量的混合得到。光谱相同的光线固然能引起同样的颜色感觉,而光谱不同的光线在某种条件下,也能引起人眼相同的颜色感觉,这叫同色异谱。   染料的混合与光的混合属于不同的过程,光线与光线的混合是两种波长的光线同时作用到视网膜上的相加过程。因此,叫加色混合,而水彩或染料的混合是减色混合。因为染料是反射某些光波而吸收其它光波。所以,由染料混合而生的颜色依赖于染料所反射的光谱成分。黄色染料主要反射光谱上黄色和邻近的绿色的波长,而吸收蓝色和其它各种颜色,这是一种相减过程;蓝色染料则主要反射蓝色和邻近的绿色的波长,而吸收黄色和其它各种颜色,这也是一种相减过程。当黄色和蓝色染料相混合时,二者都共同反射绿色带的波长,而其它所有波长的颜色或被黄色染料或被蓝色染料吸收了。所以混合的结果是绿色。因此,染料的混合是对光谱颜色的双重减法。   1853年格拉斯曼(Grassman)将颜色现象总结成颜色混合定律:   1. 人的视觉只能分辨颜色的三种变化:明度、色调、饱和度。   2. 在由两个成分组成的混合色中,如果一个成分连续地变化,混合色的外貌也连续地变化,由这一定律导出两个定律:   (1) 补色律。每一种颜色都有一个相应的补色。如果某一颜色与其补色的适当比例混合,便产生白色或灰色。如果两者按其它比例混合,便产生近似于比重大的颜色成分的非饱和色。   (2) 中间色律。任何两个非补色相混合,便产生中间色,其色调决定于两颜色的相对数量,其饱和度决定于两者在色调顺序上的远近。   3. 颜色外貌相同的光,不管它们的光谱组成是否一样,在颜色混合中具有相同的效果。换言之,凡是在视觉上相同的颜色都是等效的。由这一定律导出颜色的代替律。即相似色混合后仍相似。    如果 颜色A=颜色B,颜色C=颜色D;    那么 A+C=B+D   代替律表明,只要在感觉上颜色是相似的,便可以相互代替而得到同样的视觉效果,尽管他们两者的光谱成分是不一样的。例如,设A+B=C,如果没有B,而X+Y=B,那么A+(X+Y)=C,这个由代替而产生混合色与原来的混合色在视觉上具有相同的效果。根据代替律,可以利用颜色混合方法来产生或代替各种所需要的颜色。颜色混合的代替律是一条非常重要的定律,现代的色度学就建立在这一定律的基础上。 4. 亮度相加律。由几个颜色组成的混合色的亮度是各颜色光亮度的总和。 格拉斯曼颜色定律是色度学的一般规律,适用于各种颜色光的相加混合,但不适用于染料或涂料的混合。 9.2 颜色匹配和标定 9.2.1 颜色匹配和颜色方程   根据格拉斯曼颜色混合实验,外貌相同的颜色可相互代替。相互代替的颜色可以通过颜色匹配实验来找到。把两个颜色调节到视觉上相同或相等的方法叫颜色匹配。在进行颜色匹配实验时须通过颜色相加混合的方法,改变一个颜色或两个颜色的明度、色调、饱和度三特性,使两者达到匹配。   在颜色匹配实验中用来产生混合色的红、绿、蓝叫三原色。把为了匹配某一特定颜色所需的三原色数量叫做三刺激值。精密的颜色匹配实验是在比色仪上进行的。比色计的原理示意图如9.4 所示。人的视场分成二等分,视场的一边呈现的是待配色光,另一边投射的是红、绿、蓝三原色的混合光。让视场两边分别投射到视场中的两块屏幕上,然后通过调节红、绿、蓝三原色的强度来改变这三者之间的比例,直到所得颜色看起来与待配色的光一样为止。因此,可以用三种原色相加的比例来表示某一颜色,并可写成方程式:   (Q)≡R(R)+G(G)+B(B) (9-1) 其中(Q)是某一颜色,(R) 、(G) 、(B)是红、绿、蓝三原色,R、G、B是每种颜色的数量(三刺激值),式中“≡”是指匹配,即在视觉上颜色相同。在匹配实验中,如果被匹配的颜色很饱和,那么用红、绿、蓝三原色可能实现不了匹配,这时就需要把少量的三原色之一加到被匹配的颜色上,并与余下的两种原色相匹配。例如,对光谱的黄单光就不能用三原色的混合获得满意的匹配。这时,只用红和绿两原色相混合,而把少量的蓝原色加到黄光谱色一侧。这一颜色匹配关系仍可用方程: (Q)+B(B) (R(R)+G(G)  图9.4 比色计原理示意图 表达。这一方程在色度学中可写成: (Q) (R(R)+G(G) -B(B) 在上述可能具有负值的方程表示的颜色匹配条件下,所有的颜色,包括白黑系列的各种灰色,各种色调和饱和度的颜色都能由红、绿、蓝三原色按不同的比例相加混合产生。 9.2.2 色度图和色度坐标   通常原色的单位是这样选择的:以某一特定的白光(例如,日光色白光)作为标准,使红、绿、蓝三原色进行混合直到三原色以适当比例匹配标准白光。这时三原色的亮度值不一定相等,而我们却把每一原色光的亮度值作为一个单位看待,三者的比例定为1(1(1的等量关系。换言之,为了匹配标准白光,三原色的数量R、G、B(三刺激值)相等,即R=G=B=1。   用(R)、(G)、(B)三原色的单位向量可定义一个三维空间。颜色刺激(C)可表示为这个三维空间中的一个以原点为起点的向量(图9.5)。这个向量对应于空间中坐标为R、G、B的点。这个三维向量空间被称为(R、G、B)三刺激空间。在三刺激空间中向量的方向由三刺激值之间的比例决定,所以向量的方向表示颜色。向量的幅度表示亮度。这样,在三刺激空间中方向相同,幅度不同的向量应代表颜色相同,但亮度不同的颜色刺激。但实际上,代表不同亮度,相同颜色的点在三刺激空间中的轨迹不是直线而是略有偏离,这就是所谓的Bezold-Brucke效应。如果忽略不计这样的非线性,就可以在二维空间中表示颜色。为此,可相对于三个坐标轴对称地取一个截面。此截面通过(R)、(G)、(B)三个坐标轴上的单位向量点(1, 1, 1)(图9.5)。图此,截面的方程为(R)+(G)+(B)=1。这个截面与三个坐标轴平面的交线构成一个等边三色形,它被称为色度图(chromaticity diagram)。各个颜色刺激向量都与此色度图有一交点。因此用色度图就能表示三维空间中的所有颜色,平面上的每一个点代表一种颜色。三刺激空间中坐标为R、G、B颜色刺激向量(或其延长线)与此色度图的交点坐标为(r, g, b),用空间解析几何,不难求出r, g, b分别为:  (9-2)  图9.5 三刺激空间和色度图 在色度学中我们不直接用三原色数量(即R, G, B三刺激值)来表示颜色,而是用三原色各自在R+B+G总量中的相对比例表示颜色。三原色各自在R+G+B总量中的相对比例叫做色度坐标。所以上述r, g, b就是颜色刺激的色度坐标。某一特定颜色刺激(Q)的方程可写成:     (Q)=r(R)+g(G)+b(B) (9-3) 例如,匹配标准白光(W)的三原色光的数量R, G, B相等,所以标准白光的色度坐标为:      所以: (W)=0.33(R)+0.33(G)+0.33(B)   由于r+g+b=1,所以在 r, g, b三个变量中只需知道其中两个就可以求得第三个变量,也就是说只需要知道其中两个量,例如r和g就可以表示一种颜色。为此可把上述等边三角形的色度图投影到(R), (G)坐标平面上去,这时可得到一个直角三角形的色度图(图9.5)。这样的色度图首先是由马克斯韦(Maxwell)提出来的。因此被称为马克斯韦颜色三角形。三角形的三个顶点分别代表(R), (G), (B)三原色。在此三角形色度图中没有b坐标,但它可由b=1-(r+g)求得。现在国际上正式采用马克斯韦直角三角形作为标准色度图。 9.2.3 颜色相加原理   根据格拉斯曼颜色混合的代替律,如果有两个颜色刺激,其中第一个颜色刺激可用三原色光数量R1、G1、B1匹配出来,第二种颜色刺激可用R2、G2、B2匹配出来,第一个颜色刺激和第二个颜色刺激的相加混合色则可用三原色光数量的各自之和R、G、B匹配出来。即: R=R1+R2 G=G1+G2 B=B1+B2 由此可见,混合色的三刺激值分别为各组成色三刺激值各自之和,这称为颜色相加原理。它不仅适用于两个颜色的相加,而且可以扩展到许多颜色的相加。   设颜色刺激Q的光谱能量分布为(图9.6)。那么,它可被看作是颜色刺激的相加混合。一个任意光源的三刺激值应等于匹配该光源各波长光谱色的三刺激值  (10-3)  图9.6 颜色刺激光谱能量分布的例子 各自之和。也就是说,如果的三刺激分别为R(d(, G(d(, B(d(, 以及Q的三刺激值为R, G, B,那么  (9-4) 积分在可见光谱的范围内进行,(=380纳米-780纳米。对G和B也有类似的公式。   对某一光谱的光源来说,用特定的三原色光匹配各个波长的光谱色所需的三刺激比例是不同的。但是对任何光源来说,匹配同波长光谱色的三刺激值比例都是固定的。只是在改变光源时,由于光源的光谱功率分布不同,就需要对匹配各个波长光谱色的固定三刺激值分别乘以不同的因数。由此我们可得一种测量颜色的方法。   当我们选定了三原色光(R),(G), (B),并已知颜色视觉正常的人眼用这三原色匹配等能光谱的各波长光谱色q(所需的三刺激值(这些特定的三刺激值分别用、、表示),就可把它作为标准去计算具有不同光谱功率分布的光源的刺激值。这时只需用待测光的光谱功率分布按波长对等能光谱的三刺激值加权。因此有  (9-5) 和  (9-6) 设:有两个颜色刺激Q1和Q2的光谱功率分布分别为,和。如果下述三个方程成立,那么这两种颜色刺激是完全匹配的。  (9-7)   上式的左面的积分分别为颜色刺激Q1的三刺激值R1, G1, B1;右面的积分分别为颜色刺激的三刺激值R2, G2, B2。如果Q1和Q2具有不同的光谱功率分布,但符合颜色匹配条件,那么看起来就具有相同的颜色。这时这两种颜色就称为异谱同色(metametric colors)。 9.2.4 颜色的标定   在电视、电影、印刷等领域,以及理解人眼的颜色视觉机制都需要对颜色进行度量。现代色度学就是一门对颜色进行测量和标定的学科。狭义地讲,色度学是一种工具,它用于预测两种光谱功率成分不同的光(视觉刺激),在一定的观察条件下,在颜色上是否能匹配。广义地说,色度学应包括对复杂环境下呈现给观察者的色刺激外貌的测定方法。其中涉及目前尚未理解的复杂问题。现代色度学采用国际照明委员会(Commission International de I’Eclairage)所规定的一套颜色测量原理、数据和计算方法。我们称其为CIE标准色度学系统。 9.2.4.1 CIE色度学系统   外界的光学辐射作用于人的眼睛产生颜色感觉。因此物体的颜色既决定于外界的刺激,又决定于人眼的视觉特性。颜色的测量和标定应符合人眼的观察结果。然而,不同观察者的颜色特性多少是有些差异的,这就要求根据许多观察者的颜色视觉实验确定一组为匹配等能光谱所须的三原色数据,即“标准色度观察者光谱三刺激值”,以此代表人眼的平均颜色视觉特性用于色度学计算和标定颜色。Wright和Guild分别进行了用三原色匹配等能光谱上各种颜色的颜色匹配实验。但Wright所选用的三原色为:650纳米(红色)、530纳米(绿色)、460纳米(蓝色),而Guild所选用的三原色为630纳米、542纳米、和460纳米。   如果我们原来选择的三原色系统是R, G, B,那么R, G, B的线性组合,也可以作为新的三原色。它们两者之间的线性变换关系[A]可表示为:  (9-8) 由于是线性独立的,所以[A]的行列式。这样,以这两个原色系统中的某一个系统表示的颜色匹配函数也将是另一个原色系统表示的颜色匹配函数的线性变换。因此,如果我们已知四种特定颜色刺激在这两种原色系统中的色度坐标,那么就可以求出这个线性变换,从而把一种原色系统表示的色度坐标转换到另一原色系统中的色度坐标。根据上述原理,Guild 把他的和Wright测得的光谱颜色的色度坐标变换到一个共同的原色系统中去,这个新系统的三原色波长分别为700纳米、546.1纳米和435.8纳米,并将三原色的单位调整到相等数量相加匹配出等能白色(E光源),结果发现他们两个的研究结果很一致。因此,1931年CIE采用两人的平均结果给出匹配等能光谱色的、、光谱三刺激值。光谱三刺激值曲线如图9.7所示。这组函数原色R=700纳米, G=546.1纳米, B=435.8纳米等能光谱白色的色度E(r=g=0.33)叫做1931 CIE-RGB  图9.7 1931 CIE-RGB系统标准色度观察者光谱三刺激值曲线  图9.8 1931 CIE-RGB系统色度图 系统标准色度观察者光谱三刺激值。图9.8为根据1931 CIE-RGB系统标准观察者光谱三刺激值所绘制的色度图。光谱三刺激值与光谱色的色度坐标的关系式为:  (9-9) 其中r+g+b=1。   在色度图中偏马蹄形曲线是光谱轨迹,应注意光谱轨迹很大一部分的r坐标都是负值。1931 CIE-RGB系统的光谱三刺激值是从实验得到的。本来可以用色度学计算来标定颜色,但是由于用来标定光谱色的原色出现负值,计算起来极不方便,又不易理解。因此1931年 CIE-XYZ系统利用三种设想的或想象的原色X(红)、Y(绿)、Z(蓝),以便使得到的颜色匹配函数在所有的波长时都是正值。1931 CIE综合了几项实验研究的结果,确定了匹配等能光谱各种颜色所需的XYZ三原色刺激值,并将它命名为CIE 1931标准观察者光谱三刺激值。如图9.9所示,图的曲线分别代表匹配各波长等能光谱刺激所需的红、绿、蓝三原色的量,要想得到某一波长的光谱颜色只要按数量的红、绿、蓝设想原色相加即可。例如,为了产生波长为475纳米的颜色,需要大量的,再加上少量的和。如果x、y、z和X、Y、Z分别代替r、g、b和则公式(9-9)仍可保持。  图9.9 CIE 1931 标准观察者光谱三刺激值曲线  图9.10 CIE 1931色度图 注1:由于人眼的中央凹具有色素,所以在不同的视野测得的三刺激值曲线不同,测量的视野有2(、10(等。这里所画的适用于2(视野。 根据1931年CIE-XYZ系统可绘制出CIE 1931色度图(图9.10)。任何一种光谱色,只要我们确定出它们的X、Y、Z三刺激值的比例,我们就可以进一步用色度坐标在xy色度图中确定它的颜色特性。色度坐标(xy)是由相应的三刺激值除以三刺激值之和得出的,即:  (9-9) 因x+y+z=1,所以三个数值中只要确定了任何两个,就可以求出第三个数。在色度图中通常是以x和y来确定颜色的特性。例如,x=0.333, y=0.333即纯白色。在图9.10中x色度坐标相当于红原色的比例,y色度坐标相当于绿原色比例。从图中可见,光谱的红色波段在图的右下部,绿色波段在图的左上角,蓝色波段在图的左下部,这个图形成一个马蹄形。马蹄形线上的各点代表380纳米(紫色)780纳米(红色)之间所有的单色光。马蹄形上各波长的连线叫光谱轨迹。这些波长被称为主波长(dominant wave length)。从紫端到红紫端的连接直线是光谱上没有的由紫到红的颜色。在马蹄形三角形内的颜色包括了一切在物理上能实现的颜色。根据格拉斯曼定律,并且忽略有关的非线性,那么通过三刺激空间中两个向量的相加就可求得颜色的混合。例如,如果我们把任意的向量D和E线性相加,并把它们投影到色度图上,那么这两种颜色向量之和F将在这两个向量的端点连线上,并且位于与它们幅度成正比的位置上(图9.10)。这样我们就能确定两种颜色刺激以任意比例混合时所得的颜色。   CIE曲线可用于检验由特定的三原色混合而产生颜色的范围。例如,在电视或染料混合中,为了重现物体颜色要选择一组三原色,这相当于在色度图中选择三个点,由这三个点为顶点的三角形不一定能包括所有可见的颜色。图9.11中给出了NTSC彩色电视制式和欧洲广播联盟(EBU)( (PAL和SECAM制式采用EBU标准)中所采用的荧光粉三原色的色度坐标以及它们的标准白光C的色度坐标,只有在三角形中的颜色才是在电视监视器上能重现的颜色。选择三原色的方法之一是通过确保等量的三原色混合能产生标准白色。从理论上说,假设的等能谱白色的色度坐标是x=0.33和y=0.33,即图9.11中的W点。  图 9.11 NTSC和PAL彩色电视制式的三原色 9.2.4.2 孟塞尔(Munsell)颜色系统   迄今为止我们所收集到的论据都说明用两个色度变量就可以表示颜色。如果不用x, y直角坐标系来定义这两个变量,那么可以用以W为中心的圆柱坐标系。例如,在图9.12中取从W出发到光谱轨迹上某一点的射线。这里我们取主波长(=520纳米的点。在这条射线上各点的颜色是根据离W点的距离占全部线段距离的百分比,也就是刺激纯度(excitation purity)来决定的。在颜色的感知上  图9.12 孟塞尔颜色立体示意图 与主波长和刺激纯度这两个物理量相对应的心理物理量分别为色调和饱和度。色调与实际的颜色名称有关。例如,红、绿或蓝。饱和度是说明颜色中混入白色的程度。例如,红色是饱和的粉红色。   在彩色电视标定中常用的颜色描述系统是孟塞尔(Munsell)颜色系统[Wys 67]。这是从心理学的角度,根据颜色的视觉特点所制定的颜色分类和标定系统。目前国际上广泛采用孟塞尔颜色系统作为分类和标定表面色的方法。在这个系统中用一个三维空间的类似球体的模型把各种表面色的三种基本特性:色调、明度和饱和度全部表示出来(图9.12)。在立体模型中的每一部分各代表一个特定颜色,并给予一定的标号。其中色调分成100个等级,饱和度和明度都分成10级。在孟塞尔颜色图册中包含用纸片制成的标准颜色样品,这些样品可用于颜色的对比。 9.2.4.3 均匀颜色空间   在CIE色度图上每一点都代表一个确定的颜色。但对人眼来说,当颜色的坐标位置变化很小时,不能感觉其变化,认为是原来的颜色。由此可见,每一颜色虽然在色度图上占一个点的位置,但对视觉来说,它实际上是一个范围,这叫颜色的宽容量。研究证明它的形状是椭圆,在色度图的不同位置上颜色的宽容量的大小和长轴方向都不同。蓝色部分的宽容量最小,也就是说,人眼对蓝色的辨别力强,当坐标值略有变化时视觉就能察觉出颜色的变化。而绿色部分的宽容量最大。在色度图上端的宽容量椭圆的长轴与y轴坐标方向近于一致,而下端则与x轴较为接近。沿长轴方向坐标值要较大变化视觉才能感觉到颜色的变化,而沿短轴则反之。从这一点来看CIE色度图并不是理想的色度图。因为图上的色度空间在视觉上是不均匀的,它不能反映颜色的视觉效果。理想的色度图应使每一种颜色的宽容量都接近圆形,并且大小也较一致。为此CIE制定了CIE 1960均匀色度标尺图(CIE 1960 UCS图)。在表示色差方面它比CIE 1931色度图有了明显的改进。但在图上没有明度坐标,这对计算色差很不方便。所以,在1964年又提出了CIE 1964均匀颜色空间。在此坐标系中除了引用UCS坐标系的色坐标外还引入了亮度值,这一坐标用U*、V*、W*表示。其中U*、V*代表色度指数,W*代表明度指数。为了进一步统一评价颜色的差别方法,CIE在1976年又推荐了两个颜色空间及有关色差公式。这两个颜色空间分别为CIE 1976(L*u*v*)空间和CIE 1976(L*a*b*)空间,其中L*是明度。在CIE 1976(L*u*v*)空间中的横坐标为,纵坐标为。(图9.13),图中的E是等能光源。由x, y坐标转换为、坐标可用下列公式   图 9.13 CIE 1976 图   为了使物体色在知觉上具有均匀空间,并反映出大于阈值小于孟塞尔颜色系统所表示的色差,CIE推荐了第二个均匀颜色空间L*a*b*   式中X, Y, Z为颜色样品的三刺激值;X0, Y0, Z0为CIE标准照明体(例如,D65或A光源)经完全反射漫射体反射到观察者眼中的白色的三刺激值。 9.3 颜色视觉理论   一般地说,人类视觉系统分辨颜色的能力远高于动物。例如,猫难以区分绿色和红色,虽然这二者之间波长相差高达150纳米。而相比之下人可轻易地区分波长为590纳米和595纳米的两种颜色,这可能是由于人具有高度的智能。也正是由于这样高度的智能才使人类能以艺术的眼光欣赏丰富多彩的色彩。动物之中只有从生物进化角度来说最接近于人类的短尾猴具有与人类相近的颜色视觉。因此对短尾猴颜色视觉的研究有特殊的重要性。但令人感兴趣的是短尾猴眼睛中锥体细胞的视色素与人眼锥体细胞不同。   众所周知在人类视觉系统中存在着两种感光细胞:杆体细胞和锥体细胞。前者是暗视器官,后者是明视器官,后者在照度足够高时起作用,并能分辨颜色。已知存在着三种锥体细胞。颜色视觉的三色理论认为在视网膜中存在着三个独立的颜色处理通道,并且这些通道是由于不同锥体细胞中不同类型的视色素所造成的。三色理论能说明为什么三种颜色可以起原色的作用,它还说明某种颜色不只是由某几个固定波长的光组合而成,而且它也可以由其它波长的光组合而成。这个理论最初是由Yaung在1807年提出的,后由Helmoholtz在1862年作了进一步发展,并且得到实验结果的支持。1872年Hering又提出了颜色的对立机制理论。这个理论似乎与当时已有的三色理论相矛盾。他认为在视网膜的层次中存在着以颜色差异为基础的处理机制。这种模型也得到了许多证据的支持。最近的研究证明上述这两种颜色视觉处理模型都是正确的,但它们各自在不同的颜色信息处理层次上起作用。 9.3.1 三色理论   1807年Young提出了红、绿、蓝三种原色以不同比例混合可以产生白色和其它各种颜色的假设。这个假设为以后的颜色混合实验所证实。在此基础上1862年Helmholtz提出了一个颜色视觉的生理学理论。他假设在人眼内有三种基本的颜色视觉感觉纤维,后来发现这些假设的纤维和视网膜的锥体细胞的作用相类似。所以近代的三色理论认为三种颜色感觉纤维实际上是视网膜的三种锥体细胞。每一种锥体细胞包含一种色素,三种锥体细胞色素的光吸收特性不同,所以在光照射下它们吸收和反射不同的光波。根据心理物理学实验的结果Helmholtz假设三种颜色感觉纤维,或锥体细胞的光谱吸收曲线如图9.14所示。当  (a) (b) 图9.14  (a) Helmholtz假设的三种颜色纤维的光谱吸收曲线, (b) 根据生理学数据测得的光谱吸收曲线 色素吸收光时,锥体细胞发生生物化学变化,产生神经兴奋。锥体细胞吸收的光愈多,反应愈强烈;吸收的光少就没有什么反应。因此,当光谱红端波长的光射到第一种锥体细胞上时它的反应强烈。而光谱蓝端的光射到它上面时反应就很小。黄光也能引起这种锥体细胞的反应,但比红光引起的反应要弱。由此可见,第一种锥体细胞是专门感受红光的红胞。相似地,第二和第三种锥体细胞则分别是感受绿光和蓝光。   我们已经知道红、绿、蓝三种原色以不同比例混合可以产生白色和其它各种颜色。白光包括光谱中各种波长的成分。当用白光刺激眼睛时,会同时引起三种锥体细胞的兴奋,在视觉上就会产生白色感觉。当用黄光刺激眼睛时,将会引起红、绿两种锥体细胞几乎相等的反应,而只引起蓝细胞很小的反应。这三种细胞不同程度的兴奋结果产生黄色的感觉(图9.14 (a)中的垂直线)。这正如颜色混合时,等量的红和绿加上少量的蓝会产生黄色一样。一个短波长的蓝紫光将会引起第三种锥体细胞的强烈反应。也引起第二种锥体细胞的一些活动,而几乎不能引起第一种锥体细胞的活动。与此相应,我们用大量的蓝光,少量的绿光和极少量的红光进行混合就能复现这种蓝紫光。由此可见,由于这三种锥体细胞不同的光谱吸收曲线,使不同波长的光所造成的三种锥体细胞反应的强度不同。三者不同程度兴奋的比例关系决定我们看到的将是什么颜色。Helmholtz假定的三种锥体细胞的吸收特性不完全一致,但却非常接近。现代的研究测得存在长、中、短三种色素,它们分别单独存在于三种锥体细胞中。这些锥体细胞可分别被称为L、M、S锥体细胞。这三种色素的吸收峰分别在445纳米、535纳米和570纳米附近,并具有较宽范围的光谱感觉性(图9.14(b))。L、M、S锥体细胞相应于前面所讲的红、绿、蓝锥体细胞。   按三色理论,任意的输入刺激I(()经过锥体细胞的处理被映射到三锥体空间。图9.15中所示为这个过程的方块图。在这个模型中三个通道中的每一个都包括线性和非线性作用两部分。第一部分是I(()被一对一地映射到三变量空间,这个线性变换可用下述三个方程来描述:  (9-10)  图9.15 颜色刺激处理的神经生理学模型 其中L(()、M(()、S(()分别为L、M、S三种锥体细胞的光谱敏感曲线。第二部分是一对多的非线性变换。这个过程可解释颜色适应和其它亮度和时间的效应。这个过程可表示为:  (9-11) 其中fL、fM、fS可能是相同的,目前我们对它们还不完全了解。通过上述过程输入的光刺激被变换成三种锥体细胞的输出L0、M0、和S0。   上述模型可以解释不少颜色现象,但还有许多颜色现象仅用三色理论模型难以解释。例如,由图9.14所示的锥体细胞光谱吸收曲线可知,蓝色锥体细胞对波长大于600纳米的光波是不敏感的。所以可认为在此波长以上的刺激将产生带绿的红色感觉。但实际上我们看到的是黄红色或橙色。此外,在580纳米波长处,红、绿两种锥体细胞的光谱吸收曲线相交,这意味着这两者的反应相同,而实际上人在这时看到的是黄色。同时上述三色模型不考虑白和黑。这些现象意味着在锥体细胞以后还有一层信号处理,把经过三通道变换后的信号再变换成新的空间。这个新空间的特征似乎应该用Hering提出的颜色对立机制理论来说明。 9.3.2 颜色对立机制理论[Her 64]   早在1864年Hering就根据心理物理学的实验结果提出了颜色的对立机制理论,又叫四色理论。他的理论是根据以下的观察:有些颜色看起来是单纯的,不是其它颜色的混合色,而另外一些颜色则看起来是由其它颜色混合得来的。一般人都会认为橙色是红和黄的混合色,紫色是红和蓝的混合色。而红、绿、蓝、黄则看来是纯色,它们彼此不相似,也不象是其它颜色的混合色。因此,Hering认为存在红、绿、蓝、黄四种原色。   Hering理论的的另一个根据是我们找不到一种看起来是偏绿的红或偏黄的蓝,而只有偏黄的红,即橙色以及绿蓝色。红和绿,以及黄和蓝色的混合得不出其它颜色,只能得到灰色或白色。这就是,绿刺激可以抵消红刺激的作用;黄刺激可以抵消蓝刺激的作用。于是Hering假设在视网膜中有三对视素,白-黑视素、红-绿视素、和黄-蓝视素,这三对视素的代谢作用给出四种颜色感觉和黑白感觉。每对视素的代谢作用包括分解和合成两种对立过程,光的刺激使白-黑视素分解,产生神经冲动引起白色感觉;无光刺激时,白-黑视素便重新合成引起黑色感觉。白灰色的物体对所有波长的光都产生分解反应。对红-绿视素来说,红光作用时,使红-绿视素分解引起红色感觉;绿光作用时使红-绿视素合成产生绿色感觉。对黄-蓝视素来说,黄光刺激使它分解于产生黄色感觉;蓝光刺激使它合成于是引起蓝色感觉。因为各种颜色都有一定的明度,即含有白色的成份。所以,每一颜色不仅影响其本身视素的活动,而且也影响白-黑视素的活动。   根据Hering学说,三种视素的对立过程的组合产生各种颜色和各种颜色混合理象。当补色混合时,某一对视素的两种对立过程形成平衡,因而不产生与该视素有关的颜色感觉。但所有颜色都有白色成分,所以引起白-黑视素的分解,从而产生白色或灰色感觉。同样情况,当所有颜色同时都作用到各种视素,红-绿、黄蓝视素的对立过程都达到平衡,而只有白-黑视素活动,这就引起白色或灰色感觉。   Hering的学说很好地解释了色盲、颜色负后象等现象。色盲是缺乏一对视素(红-绿,或黄-蓝)或两对视素的结果。Hering学说的最大困难是对三原色能产生光谱上一切颜色这一现象没有给予说明。   现代生理学的许多材料都证明颜色视觉立机制的存在。Wagner等[Wag 60]发现用白光刺激金鱼视网膜的一定区域能引起某些神经节细胞的给光和撤光反应;对另一些神经节细胞的感受野,长波刺激的光只能引起一种反应,或是给光反应,或是撤光反应。而500纳米以下的的短波刺激则引起相反的反应。这说明对这种神经节细胞的感受野来说,短波和长波刺激会引起相反的效应。此外还发现某些神经节细胞具有颜色视觉的同心感受野,即某一波长的光对感受野中心起兴奋作用,对外周引起抑制作用;而其补色波长的光则对感受野中心起抑制作用,对外周引起兴奋作用。   De Valois[De val 68]等人对短尾猴的外侧膝状体细胞进行了大量的实验,他们发现这些细胞中大约有70%对光谱有对抗反应。即当用一种波长的光刺激短尾猴的视网膜时,其外侧膝状体细胞的放电效率就会增加,而用另一种波长的光刺激同一视网膜区时,其外侧膝状体细胞的放电率就会减少。这被称为对抗。颜色细胞中其余30%是非对抗反应的细胞。已发现有四种对抗颜色细胞。第一种细胞红光对它产生兴奋作用,绿光产生抑制作用,这被称为(-R+G)细胞;第二种细胞以上反的方式起作用,也就是红光起抑制作用,绿光起光奋作用。它被称为(+R-G)细胞;第三和第四种细胞以相似的方式对黄光和蓝色起作用,分别被称为(+Y-B)和(-Y+B)。有两种非对抗反应的细胞(+wh-Bl)和(+Bl-wh),它们只对明度起作用,被称为wh-Bl系统。  图9.16 颜色 视觉的信息加工过程  根据当代颜色视觉理论,可用图9.16来概括视觉系统对颜色信息的加工过程。该图说明了三种锥体细胞感受器构成的三色系统和四色对立颜色机制之间的联系,感受器(、(、(的光谱吸收峰值分别在440, 530和570纳米处。这和蓝锥细胞、绿锥细胞和红锥细胞的特性很一致。这是视网膜的三色系统。三种感受器的信息进一步向上集中共同进入一个(Y-B)单元,红光和绿光的联合效应能使(Y-B)单元的神经细胞放电率增加,蓝光能抑制这种细胞的放电率。(Y-B)的输出增加会给大脑提供黄的信息,而输出减小则提供蓝的信息。(R-G)单元接受从三种感受器来的输入,红光使(R-G)单元放电率增加产生红的反应;绿光则使这个单元放电率减少,产生绿的效应。而蓝光对(R-G)也有兴奋作用,同时不使(Y-B)输出减少,这个通路说明为什么蓝单色光能产生略带红色的效应。   (wh-Bl)叫做明度单元。任何光影响任何一种感受器时,(wh-Bl)单元都起反应。它的反应随被激发的感受器数量的增加而增加,而与它们的光谱吸收特性无关。(wh-Bl)输出的增加产生明度增加的感觉。   从以上颜色视觉模型可以看到Young-Hemholtz的三色学说和Hering的四色学说不是不可调和,而是可以彼此补充的。 9.3.3 视网膜皮层理论   到目前为止我们所讨论的颜色视觉理论都是把颜色当作一种点状特性来研究,也就是不考虑周围区域颜色特性的影响。这种点理论并不能解释颜色的时间和空间的适应性。对这些性质的本质目前还理解很少。例如,区域周围的颜色如何影响我们对该区域颜色的感知?虽然已经提出了不少建议,但至今还没有普遍接受的理论。在已提出的理论中最著名的是Land[Lan 77]的视网皮层理论。   Land理论的依据是他所进行的一些实验。这些实验的结果表明颜色的感觉在某种程度上与刺激光谱的波长无关。十九世纪时Helmholtz已经发现颜色的感知与光照无关。为了解释这点Land提出,经过视网膜三种锥体细胞处理后的信息进一步在三个独立通道中进行处理,这些通道的作用就是消除光照的影响,以使得所感知的颜色纯粹是依据物体表面的性质。他把这些独立通道称为视网膜皮层系统。每一个视网膜系统都对视野中的各种颜色独立起反应。一种主要对光谱长波光起反应,第二种主要对光谱中间波光起反应,第三种主要对短波光起反应。这样在中枢神经系统就建立了三种独立的景物图象。这三种视网膜皮层记录的不是颜色图象,而是明度各不相同的黑白图象。Land认为这三种视网膜皮层图象的不同明度的相互比较决定了颜色知觉。Land通过实验还进一步发现视觉系统仅需要两个通道就可以感知图画中的颜色。他的实验是这样做的:首先要准备两张自然景物的黑白照相底片(正片),其中一张是通过红色滤光片拍摄的,另一张是通过绿色滤光片拍摄的。拍摄时使两幅图象对准同一景物位置。然后用带有红、绿滤光片的幻灯机把用上述方法拍摄的两张正片同时投射到银幕上,即让有红色滤光片的幻灯机投射用红色滤光片拍摄的底片,用绿色滤光片的幻灯机投射绿色滤光片拍摄的底片。结果发现在银幕上出现的是具有各种颜色的图象,好象只有红色和绿色也能够复现自然环境的全部颜色。银幕的画面中包含蓝色,而通常红和绿混合不会产生蓝的效果。另一个奇怪的现象是若让带红色滤光片的幻灯机继续投射第一张底片,而拿走另一幻灯机上的绿色滤光片,即用白光来投射第二张底片,这时仍能看出银幕上的画面还有各种颜色。这似乎和颜色视觉的三色理论相矛盾。根据三色理论,在上述情况下应该只能看见红、白和粉红色。事实上,如果我们通过一个圆筒只观察上述投射图象中的一个小区域的话,那么确实也只能看到这些颜色,这似乎说明周围区域的图象背景影响我们对颜色的感知。关于视网膜皮层理论可进一步参考[Lan 74]。 9.4 颜色信息的计算机处理 9.4.1 系统颜色空间的标定[Lev 85]   在日常生活中我们在感知物体的形状和轮廓时,似乎可以只根据亮度信息,并不一定需要颜色信息,但我们确实经常根据颜色来识别和区分物体。在分割图象时,颜色也是一个重要的基本特征。因此颜色信息处理是通用计算机视觉系统中不可缺少的重要部分。输入计算机的颜色信息通常是用彩色摄象机或在黑白摄象机前面加上一组颜色滤光片的方法获得的。不论用哪一种方法,其效果都相当于用三个光谱滤波器FP(()、F((()、FB(()来得到颜色变量。这里我们把它们称为滤波器变量(、(、(,分别表示红、绿、蓝。由于颜色是外界光刺激作用于人的视觉器官而产生的主观感觉,因此在用计算机视觉系统处理颜色信息时,不可避免地需要将计算机的测量与人的颜色视觉相联系。为此需要把视觉系统得到的测量(、(、(映射到CIE色度图去,从而可以标出颜色的名称,识别物体的颜色,这就是系统颜色空间的标定(Calibration)。当然在用颜色信息分割图象时并不一定需要识别物体的颜色,但当希望参考人的颜色视觉机理进一步提高系统性能时,仍然需要把视觉系统的测量与CIE色度系统相联系。   如果视觉系统的三个滤光片特性与人眼中的三种锥体细胞特性相似,这是理想的带通滤波器。不过滤波器的形状不同,那么这相当于采用另一组与人眼不同的三原色。但这两组三原色之间的关系满足公式(9-7)表示的线性变换。为了集中研究输入刺激的色度本质,可引入有关的色度系数、、(。它们的定义是  其中。总的亮度则等于之和。滤波器变量(、(、(经过模—数转换器,变换成数字量,以便输入计算机。如果模—数转换器的最大值为8比特,那么滤波器的输出值可以定义一个大小为256×256×256的颜色立方体,如图9.17所示。颜色可被定义为这个立方体中的一个三元组((、(、(),它代表这个三维空间中的一个向量。立方体中的(0, 0, 0)点表示黑色,(256, 256, 256)表示白色。白色和黑色之间的连线表示不同的亮度等级,在这条连线上是(、(、(三个变量的等量混合。空间内任意颜色的亮度I可通过简单地把颜色向量投影到这条连线上来确定(图9.17)  图9.17 滤波器输出定义的颜色立方体   为了确定这些滤波器输出值的颜色名称,首先要确定CIE的XYZ颜色系统的刺激值与(、(、(之间的关系[Wy 67]。  (9-13) 其中(xr, yr),(xg, yg)和(xb, yb)分别是红、绿、蓝滤光片的色度系数。图9.18所示为一组典型的Kodak-Wratten分离滤光片的透射系统函数。滤光片的色度坐标可很容易地求得[Wys 67]。例如,红色滤光片的刺激值为  (9-14)  图9.18 Kodak颜色分离滤光片的透射系数函数 其中Ee是滤光片所受光照的光谱分布函数,是红色滤光片的透射率函数,、和是等能光谱的三刺激值。所以  (9-15) 蓝色和绿色滤光片也可以得到相似的公式。在上述公式中实际上是把滤光片看成是透明物体来确定它们的色度系数。应用上述(9-14)公式时还有些实际问题要考虑。其中包括摄象机或模—数转换在所研究的带宽内频谱响应是否均匀。还有颜色分离滤光片的透射率特性并不是带通的,滤光片的光谱响应不能准确知道,从而滤光片的色度系数也不能精确地确定。所以对公式(9-14)还要作若干修正[Lev 85]。   如果计算机视觉系统是用彩色电视摄象机来获取颜色信息,就需要了解彩色电视摄象机的有关光谱特性。由于摄象机原来是用于在电视接收机或监视器上显示景物图象的,因此,彩色电视摄象机的光谱特性又与彩色电视制式所采用的三原色萤光粉的光谱特性有关。图9.19上所示为PAL制式和NTSC制式红、绿、蓝摄象管为在接收机萤光屏上正确复现色度所应有的光谱灵敏度曲线。如果实际摄象管能实现上述理想的光谱灵敏度曲线,那么每一摄象管的总响应应等于各波长上的正值响应之和减掉各波长上的负值响应之和。三个摄象管光敏元件在可见光谱范围内对被拍摄的颜色刺激函数((()积分即可得出颜色的三刺激值。  图9.19 PAL 制式(a)和NTSC制式 (b)摄象管的理想光谱灵敏度曲线  (9-16) 其中R、G、B就是彩色显象管上为复现被拍摄的颜色所要求的相对信号强度,而三个摄象管分别起R、G、B信号强度的自动积分机的作用。   但实现图9.19所示的光谱灵敏度曲线是困难的。因为每条曲线上除了正值的主要面积以外,还有一定的负值部分。这样实现每一条光谱三刺激值曲线都需用两个摄象管才能满足色度复现的要求,这就过于复杂了。实际上,彩色电视系统是用三个摄象管,每一摄象管的光谱灵敏度曲线只能近似、、曲线的主要正值部分。为了提高颜色的复现质量对全部正值的、、曲线进行优选使三原色点在色度图上形成较大的三角形区域。同时,为了弥补光谱灵敏度曲线负值部分的丢失还在摄象机的输出加上适当的矩阵电路进行补偿,使经过校正的输出接近理论计算的理想光谱灵敏度曲线。   如果已知摄象机的三原色在CIE-XYZ颜色系统中的色度坐标,根据前述的“两个颜色系统的原色转换”方法就可以求得由摄象机的RGB系统向CIE-XYZ系统的转换方法。例如,已知PAL制式(R) 、(G) 、(B)三原色在CIE-XYZ系统中的色度坐标为:  可求得PAL制式RGB向CIE-XYZ系统的转换方程为  (9-17) 利用上述的转换方程,根据颜色在摄象机中的三刺激值R、G、B就可得到在XYZ系统中相应的三刺激值和色度坐标。   如果实际摄象机的特性与理想特性有较大差异,这时应用上述转换公式就会有较大误差。这时就需要用标准色板和标准白色光源进行摄象机颜色系统的标定(Calibration)。并且由于在一般的电视摄象机中还装有为补偿显象管输入输出r特性的r校正电路,使得摄象机作为计算机视觉系统的输入时,会因此带来非线性。所以还要进行输出特性的线性化处理。 9.4.2 色度信息的表示 以上讨论了用分离滤光片与黑白摄象机或彩色摄象机获取颜色信息时,根据滤波器的三刺激值P、(、B求得CIE-XYZ颜色系统中三刺激值X、Y、Z的方法。用这些方法使摄象机的颜色信息得到标定。如果不需要采用经过标定的颜色刺激值,就可直接使用P、(、B来代替以下所述中的三刺激值X、Y、Z。X、Y、Z三刺激值构成一个三维颜色空间,在此空间中包括所有由此三原色所能产生的颜色。如前9.2.2中所述,在此空间中可取一个单位截面构成一个等边三角形的色度平面。一个任意的颜色向量P在色度平面上的投影为。的坐标即为色度系数x、y、z。三角形的中心点W的坐标为,即W点代表白色。这样我们就把视觉系统设备的三刺激值标定为CIE XYZ色度系统的值。  图9.20 由设备的三刺激值得到的XYZ颜色空间和色度平面   如前所述,颜色可以用两个色度变量:色调和饱和度,加上一个非色度变量来描述。参考图9.20可见,点的色调可用角度(来定义。这里我们已选定WX线作为零色调的参考线,饱和度是由W与WC的比值来确定。即色调H和饱和度S定义为  (9-18) 其中   x, y, z是的色度坐标,表示取x, y, z中的最小值。如果用P的三刺激值x, y, z,则上式修改为[Ken 76]。  (9-19) 其中   用这种颜色描述方法的缺点是H和S都有不可避免的奇异点,即在公式中出现分母为零的情况。这样会产生不稳定。因此不宜用于区域分析算法中。因为在对特定图象作色度或饱和度的直方图统计时会产生不连续点。   替代非线性的色调和饱和度变换的方法采用三滤波器值的线性变换。例如,采用NTSC制式中的YIQ坐标变换,或PAL/SECAM彩色电视制式中的YUV[Tow 70]变换。在彩色电视系统中YIQ系统在保持良好彩色特性的同时减小了信号的频带宽度。亮度、色调和饱和度中包含的信息是不平均的。例如,我们观察到在孟塞尔颜色系统中色调分为100级,而饱和度只有10级。通常彩色电视显示亮度分64级,而色调只需32级,饱和度只需8级就足够了。这是由于我们所感兴趣的景物中的大部分颜色的色度系数位于白色附近。YIQ利用了这个性质。Y是明度信号,它用来显示黑白图象,并在4MHZ的频带宽度内发射;I(in-phase)信号在1.5MHZ的频带内对橙—青(orange—cyan)颜色差轴进行编码,Q(Quadrature)信号在0.5MHZ的频带宽度内对绿—品红(green—magenta)颜色差轴进行编码。滤波器刺激值与YIQ系统之间的关系为:  (9-20) PAL/SECAM的YUV颜色空间与NTSC的YIQ颜色空间的差别只是在YUV空间中旋转了33((图9.21)。滤波器刺激值与YUV系统之间的关系为:  (9-21) 9.4.3 颜色图象分割和颜色反射模型   目前许多颜色图象分割算法是把原来的灰度图象分割算法推广到多维颜色空间,尽管其中不少能有效地应用于实际,但大多数不能得到满意的结果。这说明颜色图象分割并不是简单的增加图象的维数,而是有其自身的特殊物理本质。颜色信息最重要的优点之一是物体表面的颜色在几何形状和位置变化时比相应的图象辐射率稳定得多,所以过去在颜色图象研究中把颜色看成是物体的不变特性,把颜色的变化看作是由于噪声引起的。但是实际上颜色的变化在很大程度上与景物的光学反射特性有关。物体的反射特性造成了物体的颜色、高光(highlight)和影调(shading)。因此需要建立物体的颜色反射模型来说明由于高光和影调引起颜色变化的规律[Hea 87 DZm86]。这里我们介绍一种双色反射模型[Kli 87, 93](dichromatic reflection model)。  图9.21 YIQ与YUV颜色空间之间的关系 当我们观察一个光亮的物体时,通常认为反射光由两种颜色组成,一种是高光区域的颜色,另一种是无光泽物体区域的颜色。双色反射模型可描述任意颜色的单光源照射不透明的绝缘材料(dielectric materials)时的反射现象。在合适的条件下这个模型也能很好地说明实际的颜色信息。  图9.22 光线在绝缘材料表面上的反射   图9.22所示为光线在不均匀的绝缘材料,如塑料和颜料,表面上的反射情况。根据Fresnel的反射定理[Hea 87],一部分入射光线在物质的界面处被立即反射。一般来说,这部分反射光的颜色大致与光源相同。其余的入射光线将穿透进入物质内部。这部分光线被物质所散射,其中某些波长被吸收,然后再次射出物质表面。这部分光的颜色决定于光照的颜色和物质的反射特性。在界面处的反射过程通常被称为镜面反射、高光或光泽,而在物质内部的反射过程被称为漫反射或无光泽反射,把这两个过程分别称为界面反射和本体反射(body reflection)可能更为确切,因为这样能说明这两个反射过程在物理本质上的差别。   基于上述讨论,双色反射模型把景物中某一点的光谱辐射L((, i, e, g)表示为界面反射分量Li((, i, e, g)和本体反射分量Lb((, i, e, g)之和,其中(是波长,i和e分别是光线的入射和出射角,g是相位角。这个模型假设光照和物体的反射光谱特性与物体表面的方向无关,这是合理的近似。这样我们就可把这两个反射分量分解为描述颜色的光谱分量c(()和描述比例因子的幅度分量m(i, e, g)([0, 1]。即 L((, i, e, g)= Li((, i, e, g)+ Lb((, i, e, g) = mi(i, e, g)ci(()+mb (i, e, g) cb(()   当摄象机记录景物的图象时,通常采用R、G、B三个参数表示由物体表面反射到摄象机的颜色光的光谱。根据颜色相加原理(9.2.3节),在成象过程中摄象机把象素位置(x, y)处的入射光线,通过三刺激值的积分,把颜色光谱变换成R、G、B三刺激值,即C(x, y)=[R, G, B]。在此过程中把每个波长上的颜色光经过颜色滤波器透射率和该波长上摄象机的响应特性加权后相加求和。因为这是线性变换,同时因为光度学的角度i, e和g与位置x和y有关,所以根据双色反射模型我们可把颜色象素值C(x, y)描述为景物中对应点处界面反射和本体反射的颜色向量,Ci和Cb的线性组合: C(x, y)= mi(i, e, g)ci+mb (i, e, g) cb 在上述公式中颜色向量Ci和Cb对一种物质的表面来说是不变的,而比例因子mi和mb则随各象素而变。   为了表示在整个物体上颜色的变化情况,我们利用颜色空间的颜色直方图。建立这个直方图的方法是把物体上所有象素的颜色投影到颜色空间中去。双色反射模型假设景物中只有一个光源,没有背景光和物体之间的相互反射。在此假设下,物体上所有象素的颜色是界面反射颜色Ci和本体反射颜色Cb的线性组合。因此,在物体区域内颜色的变化取决于几何比例因子mi和mb,而Ci和Cb保持不变。与此相应,Ci和Cb在颜色空间中形成一个双色平面。在此双色平面内颜色象素形成一个稠密的集群,它的形状与物体材料的几何特性、界面反射以及物体形状密切相关,我们可以利用这个关系来确定颜色象素集群的特征。为便于说明,假设本体反射是漫反射,并且界面反射可以用下述函数来描述:图绕理想的镜面反射角形成一个旋转对称的陡峭尖峰。这是实际景物的简化模型。图9.23所示为一个光亮的圆柱,图中左部画出了本体或界面反射分量的幅度为常数的轨迹,  图9.23 圆柱形物体在双色平面中颜色象素聚集的形状 右部所示为在双色平面上相应的颜色集群。这张图表示颜色空间中象素颜色直方图的形状。为便于说明把颜色象素分类为无光泽象素、高光象素和剪截象素。   无光泽象素是景物中在观察方向上只呈现出本体反射的象素的投影。这些象素的颜色只取决于本体反射的颜色,其幅度和物体的局部表面法线与光照方向之间的夹角成比例。所以在颜色空间中无光泽象素的颜色沿本体反射向量Cb的方向形成一条无光泽线。   高光象素是景物中下述点的投影:这些点在观察者方向上同时呈现本体反射和界面反射。在高光区域中所有象素的颜色位于下述直线上:在此直线上本体反射mbH为常数,而只有界面反射量的变化。因此,这些象素颜色在颜色空间中形成的高光直线与界面反射向量Ci平行,并且是从代表所有位置高光象素的本体反射分量mbH的无光泽集群出发的。与相邻位置的高光象素(这些相邻象素的本体反射的幅度略有不同)组合在一起,所有的高光象素在颜色空间中形成一个斜的楔子形的高光集群。如果在景物中物体上不止一处有高光,那么每一处高光都在颜色空间形成一条光线。   剪截颜色象素是一些反射光超过摄象机的动态范围的高光象素,取决于物体的颜色,可能出现在一种原色的通道上超过动态范围,而在其它两个原色通道上没有超过的情况,这时高光集群在颜色立方体的边界面上发生弯曲,如果在两个原色通道饱和,那么就在颜色立方体边界的交边上出现高光集群的弯曲。在高光反射的中心点处可能在三个原色通道上都超过摄象机的动态范围,那么这时即使光照不是白色的,但这些点看起来也是白色的。   为了概括上述讨论,在图上画出颜色集群的一般形状,虽然对某个特定物体来说,颜色集群不一定充满整个平行四边形,但颜色集群确实能可靠地呈现出某些很有用的特征。在图9.24中这些特征用粗实线表示。颜色集群通常可提供一条无光泽线,物体区域中的无光泽象素都出现在这条线上,取决于物体形状和光照的几何位置,颜色集群上可能有若干  图9.24 颜色空间中颜色集群的形状 高光线,我们用最亮的高光线作为所有这些线的代表。如果有颜色幅度超过摄象机动态范围的情况,那么高光线就发展成为剪截线。通过在颜色空间里搜索这些线就可以分析颜色集群的形状。再由这些线可以确定平行四边形的形状和双色平面的方向。 [Kil 87]介绍根据双色反射模型,利用对颜色集群的分析可以确定光照的颜色,从而可去除颜色光源的影响;此外还可检测和去除高光,分离后的无光泽图象对观察者的方向变化不敏感,从而可抽取可靠的特征用于立体视觉和运动视觉。同时高光图象本身也可提供关于光源和表面方向的信息[Ton 89]。由此可见检测和去除高光已成为颜色图象处理中的重要步骤,除了利用双色模型外还发展了不少其它算法[Ton 89] [Ger 87]。 参考文献 [荆其诚91] 荆其诚,焦书兰,喻伯林,胡维生,色度学,科学出版社,1991。 [荆其诚87] 荆其诚,焦书兰,纪桂萍,人类的视觉,科学出版社,1987。 [Dzm 86] D’Zmura, M. and Lennie, P., Mechanisms of Color Constancy, J. opt. Soc. Am. A, Vol.3, No.10, 1986, pp1622-1672. [De Val 68] De Valois, R.L, and Jacobs, G.H., Primate Color Vision, Science, 1968, 152, pp 533-540. [Ger 87] Gershon, R., et. al, Highlight identification Using chromatic information Proc. of the Int. Conf. On Computer Vision, 1987, PP161-170. [Hea 87] Healey, G. and Binford, T.O., The Role and use of Color in general Vision System, Proc. of the ARPA Image Understanding Workshop, DARPA, Arlington, VA, 1987, PP599-613. [Kli 87] KlinKer, C.J., Shafer, S.A., and Kanade, T., Using a Color reflection model to separate highlights from Object Color, Proc. of the Int. Conf. On Computer Vision, 1987, New York, PP145-150. [Kli 93] KlinKer, G.I., A Physical approach to Color image understanding, A.K.Peters, Welleslay, Massachusetts, 1993. [Lan 74]Land, E.H., The retinal theory of Color Vision, Proceedings of the IEEE, Vol.47, No.1, 1974, PP23-58. [Lan 77] Land, E.H., The retinal theory of Color Vision, Scientific American, Vol.237, No.6, Dec.1977, PP108-128. [Lev 85] Levine, M.D., Vision in man and machine, McGraw-Hill Book Company, 1985. [Nov 87] Novak, C., and Sahfer, S., Color edge detection, Proc. of the Image Understanding Workshop, 1987, PP 35-37. [Tow 70] Townsend, B., PAL Color television, 1970. [Ton 89] Tominaga, S., and Wandel, B.A., Standard Surface reflectance model and illuminant estimation, J. Opt. Soc, Am. A., Vol.6, No.4, 1989, PP576-584. [Wag 66]]Wagner, H.G., MacNichol, E.F. Jr., and Wolbarsht, M.L. The response Properties of single ganglion cells in the goldfish, retina, J.Gen. Physiol., 1960, 43; pp45-62.