XIDIAN
西安电子科技大学多媒体研究所
http://www.mti.xidian.edu.cn
数字图像基础数字图像应用
图像增强(去噪)
图像分割(边缘检测)
目标表达、识别、跟踪
图像匹配(数据融合)
压缩与编码( JPEG2000)
图像数据库
基于内容检索(手写体识别,人脸识别)
信息隐藏与数字水印图像数字化过程
图像数字化过程就是对连续图像 f(x,y)进行空间和幅度离散化的过程。
采样过程
X,Y方向分别采样
满足采样定理
量化(对灰度或者颜色样本的离散化)
黑白灰度图像
彩色(与颜色空间相关)
图像数字化设备
光源
光传感器(光电转换)
扫描系统
扫描仪
CCD(电荷耦合器件)阵列
CMOS
图像基本属性
分辨率
显示分辨率(点距)
图像分辨率(象素数目)
象素深度(位数)( alpha channel)
真彩色、伪彩色,直接色
伪彩(颜色查找表)
直接色(三种压颜色分别查找表)
视觉系统对颜色和亮度的响应特性视觉系统对颜色的感知
RGB相加混色模型绝大部分可见光谱可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。在颜色重叠的位置,
产生青色、洋红和黄色。
因为 RGB 颜色合成产生白色,它们也叫作加色。
将所有颜色加在一起产生白色 ── 就是说,所有光被反射回眼睛。加色用于光照、
视频和显示器。例如,显示器通过红、绿和蓝荧光粉发射光线产生彩色。
图像的 RGB颜色模型
CMY相减混色模型
CMYK模型以打印在纸张上油墨的光线吸收特性为基础,白光照射到半透明油墨上时,部分光谱被吸收,部分被反射回眼睛。
理论上,青色 (C),洋红 (M)
和黄色 (Y)色素能合成吸收所有颜色并产生黑色。由于这个原因,
这些颜色叫作减色。
因为所有打印油墨都会包含一些杂质,这三种油墨实际上产生一种土灰色,必须与黑色 (K) 油墨混合才能产生真正的黑色。将这些油墨混合产生颜色叫作四色印刷。
图像的 CMYK颜色模型相加色与相减色关系
RGB彩色空间和 CMY彩色空间的表示法颜色模型的空间表示颜色模型关系示意色度 -饱和度 -亮度
HSL(HSB)颜色模型
hue
saturation
lightness
(brightness)
VGA调色板基于人类对颜色的感觉,
HSL 模型描述颜色的三个基本特征:
色调是从物体反射或透过物体传播的颜色。在 0 到 360
度的标准色轮上,色相是按位置度量的。在通常的使用中,
色 相是由颜色名称标识的,比如红、橙或绿色。
饱和度,是指颜色的强度或纯度。饱和度表示色相中灰成分所占的比例,用从 0%(灰色)到 100%(完全饱和)的百分比来度量。在标准色轮上,从中心向边缘饱和度是递增的。
亮度是颜色的相对明暗程度,通常用从 0%(黑)到 100%(
白)的百分比来度量。
图像的 HSL颜色模型
L*a*b 颜色模型 是在 1931 年国际照明委员会( CIE) 制定的颜色度量国际标准的基础上建立的。 1976 年,这种模型被重新修订并命名为 CIE L*a*b。
L*a*b 颜色设计为与设备无关;不管使用什么设备(如显示器、打印机、计算机或扫描仪)创建或输出图象,这种颜色模型产生的颜色都保持一致。
L*a*b 颜色由亮度或光亮度分量 (L) 和两个色度分量组成;两个分量即 a 分量
(从绿到红)和 b 分量(从蓝到黄)。
它是均匀的颜色空间,可以通过欧式距离测量颜色之间的距离
A,光度 =100(白)
B,绿到红分量
C,蓝到黄分量
D,光度 =0(黑)到红分量图像的 Lab颜色模型色域是一个色系能够显示或打印的颜色范围。人眼看到的色谱比任何颜色模型中的色域都宽。
在颜色模型中,L*a*b具有最宽的色域,它包括 RGB和 CMYK色域中的所有颜色。通常 RGB色域包含能在计算机显示器或电视屏幕(发出红、绿和蓝光)上所有能显示的颜色。因而一些诸如纯青或纯黄等颜色不能在显示器上精确显示。
CMYK色域较窄,仅包含使用印刷色油墨能够打印的颜色。
当不能被打印的颜色在屏幕上显示时,它们称为溢色 ── 即超出 CMYK色域之外。
颜色模型的色域颜色空间分类
混合型
RGB
CMYK
非线性亮度 /色度
L*a*b
YUV,YIQ等
强度 /饱和度 /色度
HSV(L,I)等为了使用人的视角特性以降低数据量,通常把 RGB空间表示的彩色图像变换到其他彩色空间。
1,YIQ,YUV和 YCrCb
2,HSV,HSL
YIQ适用于 NTSC彩色电视制式
YUV适用于 PAL和 SECAM彩色电视制式
而 YCrCb适用于计算机用的显示器彩色空间的线性变换标准
YUV与 YIQ模型在彩色电视制式中,使用 YUV和 YIQ模型来表示彩色图像。
在 PAL彩色电视制式中使用 YUV模型,Y表示亮度,UV用来表示色差,U,V是构成彩色的两个分量;在 NTSC彩色电视制式中使用 YIQ模型,其中的 Y表示亮度,I,Q是两个彩色分量。
YUV/YIQ特点
亮度信号 (Y)和色度信号 (U,V)是相互独立的
可以利用人眼的特性来降低数字彩色图像所需要的存储容量。
彩色空间的线性变换标准
YUV与 RGB彩色空间变换
Y = 0.299R + 0.587G + 0.114B
U = - 0.147R- 0.289G + 0.436B
V = 0.615R - 0.515G - 0.100B
写成矩阵的形式:
彩色空间 RGB-YUV
YIQ与 RGB彩色空间变换
Y = 0.299R + 0.587G + 0.114B
I = 0.596R - 0.275G - 0.321B
Q = 0.212R - 0.523G + 0.311B
写成矩阵的形式:
彩色空间 RGB-YIQ
YCrCb与 RGB彩色空间变换数字域中的彩色空间变换与模拟域的彩色空间变换不同。它们的分量使用 Y,Cr和 Cb来表示,与 RGB空间的转换关系如下:
Y= 0.299R+ 0.578G+ 0.114B
Cr= (0.500R- 0.4187G- 0.0813B)+ 128
Cb=(-0.1687R- 0.3313G+ 0.500B)+ 128
写成矩阵的形式:
彩色空间 RGB-YCrCb
MPEG7中颜色空间
R,G,B
Y,Cr,Cb
H,S,V
HMMD
Linear transformation matrix with reference
to R,G,B
Monochrome ( Y only)
图像的种类
矢量图(绘制)
点位图(采集)
矢量图形,是由叫作矢量的数学对象所定义的直线和曲线组成的。矢量根据图形的几何特性来对其进行描述,矢量图形与分辨率无关。
位图图象,也叫作栅格图象。位图图象是用小方形网格(位图或栅格),即人所共知的象素来代表图象,每个象素都被分配一个特定位置和颜色值。
标准单色图 标准灰度图图像的种类( 1)
256色标准图像 24位标准图像图像的种类( 2)
256色标准图像转换成的灰度图 24位标准图像转换成的灰度图图像的种类( 3)
图像的种类:伪彩色红外图像示意图
γ的概念
y= xn? 输出= (输入 )γ
光电转换特性都是非线性的:幂函数特性 (power-law)
按照惯例,,输入,和,输出,都缩放到 0~ 1之间。
整个系统的传递函数是一个幂函数:
它的指数 γ等于所有单个部件的 γ的乘积。
真实地再现原始场景明亮环境 γ = 1 暗淡环境 γ?1.25 黑暗环境 γ?1.5
伽马 (?)校正
γ校正
CRT显示设备 γ?2.5
NTSC电视标准需要摄象机具有 γ = 0.45的幂函数,现在采纳 γ = 0.5的幂函数。 PAL和 SECAM电视标准指定摄象机需要具有 γ = 0.36的幂函数,实际的摄象机可能会设置成 γ = 0.45或者 0.5。 适合,暗淡环境,。
可引入 γ值非线性转换函数的环节:
camera_gamma,摄象机中图像传感器的 γ
encoding_gamma,编码器编码图像文件时引入 γ
decoding_gamma,译码器读图像文件时引入 γ
LUT_gamma,图像帧缓存查找表中引入 γ
CRT_gamma,CRT的 γ( 通常 γ = 2.5)
伽马 (?)校正( 2)
BMP文件格式位图文件 (Bitmap-File,BMP)格式是 Windows采用的图像文件存储格式,由 4个部分组成:位图文件头 (bitmap-file
header),位图信息头 (bitmap-information header),彩色表 (color table)和定义位图的字节阵列。 文件结构图像文件格式
GIF文件格式
GIF(Graphics
Interchange
Format)格式 由
CompuServe公司于 87年开发,版本号 GIF87a,89
年扩充后版本号为 GIF89a。
GIF图像文件以块 (block)为单位存储信息。 GIF
文件采用 LZW压缩算法来存储图像数据。
文件结构图像文件格式
JPG文件格式
JPEG(Joint Photogaphic Experts Group)是一种连续色调、
多级灰度、静止图像的数字图像压缩编码方法。它是彩色、灰度、静止图像的第一个国际标准。它的彩色空间采用 CCIR 601
标准(现改为 ITU-R BT.601标准),每个分量、每个像素的电平规定为 255级,用 8位代码表示。
JPEG算法的核心是基于离散余弦变换的编码方式。算法具有四种操作方式:
1,顺序编码; 2,累进编码; 3,无失真编码; 4,
分层编码。
图像文件格式文件格式网址
http://www.wotsit.org/
其他各种网站